为什么C++编译器不能支持对模板的分离式编译
刘未鹏(pongba)
C++的罗浮宫(http://blog.csdn.net/pongba)
首先,一个编译单元(translation unit)是指一个.cpp文件以及它所#include的所有.h文件,.h文件里的代码将会被扩展到包含它的.cpp文件里,然后编译器编译该.cpp文件为一个.obj文件(假定我们的平台是win32),后者拥有PE(Portable Executable,即windows可执行文件)文件格式,并且本身包含的就已经是二进制码,但是不一定能够执行,因为并不保证其中一定有main函数。当编译器将一个工程里的所有.cpp文件以分离的方式编译完毕后,再由连接器(linker)进行连接成为一个.exe文件。
举个例子:
//---------------test.h-------------------//
void f();//这里声明一个函数f
//---------------test.cpp--------------//
#include”test.h”
void f()
{
…//do something
} //这里实现出test.h中声明的f函数
//---------------main.cpp--------------//
#include”test.h”
int main()
{
f(); //调用f,f具有外部连接类型
}
在这个例子中,test. cpp和main.cpp各自被编译成不同的.obj文件(姑且命名为test.obj和main.obj),在main.cpp中,调用了f函数,然而当编译器编译main.cpp时,它所仅仅知道的只是main.cpp中所包含的test.h文件中的一个关于void f();的声明,所以,编译器将这里的f看作外部连接类型,即认为它的函数实现代码在另一个.obj文件中,本例也就是test.obj,也就是说,main.obj中实际没有关于f函数的哪怕一行二进制代码,而这些代码实际存在于test.cpp所编译成的test.obj中。在main.obj中对f的调用只会生成一行call指令,像这样:
call f [C++中这个名字当然是经过mangling[处理]过的]
在编译时,这个call指令显然是错误的,因为main.obj中并无一行f的实现代码。那怎么办呢?这就是连接器的任务,连接器负责在其它的.obj中(本例为test.obj)寻找f的实现代码,找到以后将call f这个指令的调用地址换成实际的f的函数进入点地址。需要注意的是:连接器实际上将工程里的.obj“连接”成了一个.exe文件,而它最关键的任务就是上面说的,寻找一个外部连接符号在另一个.obj中的地址,然后替换原来的“虚假”地址。
这个过程如果说的更深入就是:
call f这行指令其实并不是这样的,它实际上是所谓的stub,也就是一个jmp 0xABCDEF。这个地址可能是任意的,然而关键是这个地址上有一行指令来进行真正的call f动作。也就是说,这个.obj文件里面所有对f的调用都jmp向同一个地址,在后者那儿才真正”call”f。这样做的好处就是连接器修改地址时只要对后者的call XXX地址作改动就行了。但是,连接器是如何找到f的实际地址的呢(在本例中这处于test.obj中),因为.obj与.exe的格式是一样的,在这样的文件中有一个符号导入表和符号导出表(import table和export table)其中将所有符号和它们的地址关联起来。这样连接器只要在test.obj的符号导出表中寻找符号f(当然C++对f作了mangling)的地址就行了,然后作一些偏移量处理后(因为是将两个.obj文件合并,当然地址会有一定的偏移,这个连接器清楚)写入main.obj中的符号导入表中f所占有的那一项即可。
这就是大概的过程。其中关键就是:
编译main.cpp时,编译器不知道f的实现,所以当碰到对它的调用时只是给出一个指示,指示连接器应该为它寻找f的实现体。这也就是说main.obj中没有关于f的任何一行二进制代码。
编译test.cpp时,编译器找到了f的实现。于是乎f的实现(二进制代码)出现在test.obj里。
连接时,连接器在test.obj中找到f的实现代码(二进制)的地址(通过符号导出表)。然后将main.obj中悬而未决的call XXX地址改成f实际的地址。完成。
然而,对于模板,你知道,模板函数的代码其实并不能直接编译成二进制代码,其中要有一个“实例化”的过程。举个例子:
//----------main.cpp------//
template<class T>
void f(T t)
{}
int main()
{
…//do something
f(10); // call f<int> 编译器在这里决定给f一个f<int>的实例
…//do other thing
}
也就是说,如果你在main.cpp文件中没有调用过f,f也就得不到实例化,从而main.obj中也就没有关于f的任意一行二进制代码!如果你这样调用了:
f(10); // f<int>得以实例化出来
f(10.0); // f<double>得以实例化出来
这样main.obj中也就有了f<int>,f<double>两个函数的二进制代码段。以此类推。
然而实例化要求编译器知道模板的定义,不是吗?
看下面的例子(将模板的声明和实现分离):
//-------------test.h----------------//
template<class T>
class A
{
public:
void f(); // 这里只是个声明
};
//---------------test.cpp-------------//
#include”test.h”
template<class T>
void A<T>::f() // 模板的实现
{
…//do something
}
//---------------main.cpp---------------//
#include”test.h”
int main()
{
A<int> a;
f(); // #1
}
编译器在#1处并不知道A<int>::f的定义,因为它不在test.h里面,于是编译器只好寄希望于连接器,希望它能够在其他.obj里面找到A<int>::f的实例,在本例中就是test.obj,然而,后者中真有A<int>::f的二进制代码吗?NO!!!因为C++标准明确表示,当一个模板不被用到的时侯它就不该被实例化出来,test.cpp中用到了A<int>::f了吗?没有!!所以实际上test.cpp编译出来的test.obj文件中关于A::f一行二进制代码也没有,于是连接器就傻眼了,只好给出一个连接错误。但是,如果在test.cpp中写一个函数,其中调用A<int>::f,则编译器会将其实例化出来,因为在这个点上(test.cpp中),编译器知道模板的定义,所以能够实例化,于是,test.obj的符号导出表中就有了A<int>::f这个符号的地址,于是连接器就能够完成任务。
关键是:在分离式编译的环境下,编译器编译某一个.cpp文件时并不知道另一个.cpp文件的存在,也不会去查找(当遇到未决符号时它会寄希望于连接器)。这种模式在没有模板的情况下运行良好,但遇到模板时就傻眼了,因为模板仅在需要的时候才会实例化出来,所以,当编译器只看到模板的声明时,它不能实例化该模板,只能创建一个具有外部连接的符号并期待连接器能够将符号的地址决议出来。然而当实现该模板的.cpp文件中没有用到模板的实例时,编译器懒得去实例化,所以,整个工程的.obj中就找不到一行模板实例的二进制代码,于是连接器也黔驴技穷了。
分享到:
相关推荐
2. **Visual C++ 6**:这是微软发布的一个集成开发环境(IDE),它包含了C++编译器、调试器、资源编辑器等一系列工具,用于编写、调试和发布C++应用程序。它的用户界面友好,且支持可视化设计,使得代码编写更为直观...
C++支持分离式编译,允许将程序分割成多个文件,分别进行编译。 命名空间(namespace)可以避免名字冲突,using声明允许在代码中直接使用标准库中的组件,如cin和cout,但要小心避免冲突。 缓冲区(buffer)是内存...
在Visual Studio 2008(VS2008)环境下,类模板的定义和实现通常需要放在同一个头文件中,因为该版本的编译器可能不支持模板的分离式定义和实现。这与后来的C++标准(如C++11及以后)中对模板的跨文件支持不同。 ...
- **编译式**:源代码需要通过编译器转换为机器码。 - **通用**:适用于多种应用场景,如操作系统、游戏开发等。 - **大小写敏感**:标识符区分大小写。 - **不规则**:语法灵活,但也有复杂性和不一致性。 - *...
完成源代码编写后,需要使用C++编译器如GCC或Clang将其编译为可执行文件。编译时可能需要链接`std::filesystem`库(如果使用C++17以上版本)或`boost::filesystem`库。 10. **执行与验证**: 运行生成的可执行...
编译器是这个领域的核心工具,它将高级编程语言(如C++、Java或Python)编写的源代码转换为特定机器架构的机器语言。这涉及到一系列复杂的步骤,包括词法分析、语法分析、语义分析、优化和目标代码生成。 1. **词法...
1. **C++语言特性**:C++是一种静态类型的、编译式的、通用的、大小写敏感的、不仅支持过程化编程,也支持面向对象编程和泛型编程的编程语言。它扩展了C语言,引入了类、模板、异常处理、命名空间等概念。 2. **...
1. **C++新标准**:自C++11以来,C++有了很多新的特性和改进,如智能指针、lambda表达式、右值引用等,但VC++ 6.0并不支持这些新特性。 2. **升级选择**:考虑到现代C++的发展,开发者可能需要考虑升级到更现代的IDE...
12. **Qt Designer**:这是一个可视化的GUI设计工具,用户可以通过拖放组件,调整布局,生成.ui文件,然后通过moc预处理器和uic编译器将其转换为C++代码。 13. **Qt的编译与部署**:Qt应用程序的编译涉及到 moc(元...
Visual C++ 6.0 的集成开发环境集成了源代码编辑器、编译器、调试器和资源编辑器等多方面功能,为开发者提供了一站式的编程体验。用户可以通过它创建、编辑、编译和运行C++项目。 2. **MFC(Microsoft Foundation ...
- 实现遵从性(Implementation compliance)规定了实现C++编译器时应遵守的要求。 - 本国际标准的结构(Structure of this International Standard)概述了标准文档的组织方式。 - 语法记法(Syntax notation)...
1. **C++编程语言基础**:金鱼游戏的源代码是用C++编写的,这是一种静态类型、编译式的通用编程语言,强调性能、灵活性和面向对象的特性。在该项目中,开发者可能使用了C++的基础语法,如变量定义、控制结构(if-...
例如,C++编译器通常采用前后端分离的方式,前端处理语言特性,后端生成特定平台的目标代码。 6. 编译技术在软件开发和维护中的应用广泛,如静态代码分析工具用于检查代码质量,动态分析工具帮助调试和性能优化,...
- **过程式编程**: 同时也支持传统的过程式编程风格。 #### 二、过程性编程技术与面向对象技术 - **过程性编程**: - 强调算法的实现,关注的是如何解决问题的具体步骤。 - 数据和处理数据的函数通常是分离的。 ...
此外,C++支持一种称为“分离式编译”的策略,其中头文件仅包含声明,而源文件包含实现。这样可以提高编译速度,因为只有当源文件改变时,与其相关的依赖文件才需要重新编译。 总的来说,C++中的头文件和源文件是...
C++为了支持函数重载,会对函数名进行修饰,而C语言则不会,所以需要extern "C"来指示编译器按照C语言的方式来处理函数名。 Java作为一种完全的面向对象语言,其语法和核心概念与C和C++有着很大的不同。Java的跨...
在完成这个课程设计的过程中,学生不仅可以巩固C++编程基础,还能学习到软件工程的实践知识,如需求分析、系统设计、测试和文档编写,这对未来的职业发展非常有益。通过不断地实践和优化,他们可以打造出一个高效、...
C++是一种静态类型、编译式、通用的、大小写敏感、不仅支持过程化编程,也支持面向对象编程的程序设计语言。在这个项目中,C++被用于编写游戏的核心逻辑,包括棋盘状态的管理、玩家交互、游戏规则的判断等。 2. **...
在编译这些源码时,你需要安装Qt4开发环境,并配置好编译器。Qt Creator是一个集成开发环境,包含了项目管理、代码编辑、调试和构建工具,是学习和开发Qt应用的理想选择。 总的来说,这份"C++ GUI Qt4编程"的源码集...
14. **编译器警告**:将编译器警告视为错误,通过设置更严格的编译选项来捕获潜在问题。 15. **代码审查**:定期进行代码审查,这有助于发现潜在问题,提升团队间的知识共享。 这些原则和最佳实践构成了高质量C++...