一切缘起于思维模式的差别.
最近因为自己在开发对象数据库软件, 所以对相关学科现状进行了比较深入的了解, 前不久就惊奇的发现原来这30年里统治关系数据库技术的 实体/关系模型 其实源出一位华人前辈 Peter Chen (陈品山)之手, 他曾就读于卡内基梅隆大学, 后在麻省理工,加州大学洛杉矶分校和哈佛大学出任访问教授, 现任教于路易斯安那州立大学计算机科学系.
在后来更多的阅读中了解到, 在陈教授提出该模型获得巨大成功之后, 也有很多同行朋友问起他怎么居然能想到这么优秀的理论, 而他反复思考以后得出的结论是: 很可能要归于中华的文化传承, 他举例说汉字的多种造字法, 将之与拼音文字比较, 同时发现了古埃及文字与汉字的惊人相似之处. 它们都是巧妙的仿效和利用了大自然的事物模型来阐释语义. 汉语文字其实已经是一种对自然界万千事物的很好的建模.
http://bit.csc.lsu.edu/~chen/pdf/erd.pdf
*The Entity-Relationship Model--Toward a Unified View of Data (only the first 5 pages of the 28-page paper)
ACM Transactions on Database Systems, Vol. 1, No. 1, March 1976, Pages 9 - 36 (file size: 1.68 Meg bytes) . (Note: only the first 5 pages of the paper are provided here. For the full paper, please download it from the ACM Digital Library by searching “Peter Pin-Shan Chen” or “Peter Chen”. ) (This paper is one of the most cited papers in the computer field. It was selected as one of the most influential papers in computer science in a survey of over 1,000 computer science professors.)
这两天出于偶然的考虑决定仔细读一遍陈教授这篇广为征引的巨著, 着实所获匪浅. 最为撼动的是这篇论文发表时间是1976年, 比我还大了三岁, 到现在已经过去三十年了. 经历了这三十年IT技术风起云涌, 突飞猛进的岁月, 这个模型却未经多大改动, 仍然被广泛使用. 感慨它作为计算机科学如此的中流砥柱, 恒久不衰的同时, 也增加了一些有所突破的信心, 毕竟30年对日新月异的计算机技术来说绝对称得上是大限了.
同时也了解到, 在E/R模型之前, 已经有3种主流数据模型: 网络模型, 关系模型和实体集合模型, 同时发现那时候已经有了初具形态的SQL语言. 网络模型缘起于计算机数据结构, 是离计算机实现最近的模型. 关系模型和实体集合模型则基于数学上的关系论和集合论, 极为抽象.
值得一提的是通常被我们翻译为 "关系模型" 的 "Relational Model", 我觉得更应该把它翻译为 "泛关系模型", 不仅因为它本身是把一切都看作一系列域的具体取值所构成的元组, 即它的"Relation", 更是由于现有的翻译给中国的计算机业者带来了实质的混淆和损失, 在一些关键场合把 "泛关系模型" 与 "实体/关系模型" 混为一谈. 包括认识到这个问题之前的我在内, 凡是学习过数据库理论课程的人恐怕都熟知关系数据库的Normalization过程, 用来衡量其结果的第1到第5范式(Normal Form, 简称 1NF, 2NF, 3NF...) 以及 BCNF. 甚至还有很多人以此津津乐道, 作为考题等等, 更有甚者拿来作为学问的炫耀. 然而, 这个过程和诸多的NF却完全是 "泛关系模型" 所特有的东西. 三十年前, 陈教授的这篇 "one of the most cited papers in the computer field" 所要明确阐明的其中一个事实, 正是说一个 实体/关系模型, 不需要变换操作就已经直接是类似于3NF, 并且语意更加清晰的模型. 原文是: We shall show that the entity and relationship relations in the entity-relationship model are similar to 3NF relations but with clearer semantics and without using the transformation operation (P28, The Entity-Relationship Model-Toward a
Unified View of Data, PETER PIN-SHAN CHEN).
直到三十年后的今天, 不知还有多少人仍将3NF视为金科玉律, 拿来衡量和评价一个数据库方案设计, 而且不排除很多计算机届的专家和学者. 我觉得作为西方人仍然沿用 "泛关系模型" 以及 "泛关系论" 来完成设计工作不足为奇, 因为从他们的文化背景就决定了他们很难从思维中直接把自然事物转换为 "实体/关系模型". 他们的办法是发展抽象数理方法, 得出一些简单原则, 然后逐步推演. Database Normalization正是这样一个过程. 可以说, 就这样抽象推导和演算成了西方人的长处. 但是作为一个东方人来说, 如果没有仔细的研究看透模型背后的奥妙, 恐怕就只能以 "浅薄" 来形容了, 至少没有认真读懂陈前辈的这篇精彩著作, 甚至根本没有想过去读. 缺乏这种钻研精神本身就足够冠以 "肤浅" 的形容了.
同时我也明白了本科时候《数据库》这门课为什么考不及格了, 我的思维方式主要靠形象影射, 很多时候是在大脑里绘一些直观的动画来计算和设计, 学过的理论是把它融化于大脑里, 真正的思维和设计都是用自然, 直观的形象推演和表达(像陈教授讲的汉字的构成法), 从来不以公式为主线方向. 可能并不是每个人都这样思考, 因为我中学的物理老师曾经说看到我在下面做题的时候只是闭上眼睛去想, 等别人在本子上画图,列式子演算出结果的时候, 我早就直接写出正确答案的数字了. 不过我相信我是按照中华古文化的 "人天合一" 的思想来考虑问题的, 法天地, 法万物. 所以我高数也学不好, 因为它的公式跟自然少有联系. 然而《数据库》这门课的教材却不清不白的把各种模型和方法罗列了个大概, 考试也更多的是这些概念和演算题目. 所以现在想想, 当时考不过也不算丢脸了. 其实IT方面中文翻译资料的浅薄和劣质是一个普遍现象, 本来东方式思维对抽象理论的理解就相对西方人更弱, 加上缺乏深刻的东方式的思考和科研 -- 我们其实正在葬送大自然赋予我们的伟大东方智慧!
三十年前, 陈前辈以旅美华人的身份成功用自然模型打破了计算机模型与数学模型的僵局.
三十年后, 我要以一个本土中国人的身份, 用自然模型打破面向对象模型与非面向对象模型的僵局.
Ableverse 5 TOB 正是一个以面向对象为基础, 萃取了网络模型的高效与关系模型的成熟简明而融合成的新一代高性能对象数据库系统. 它所提出的 对象/关系/亲系 模型也正是一个更好的反映出自然事物关系的数据模型. AV5TOB 的发布已经指日可待.
另外想对国家对科研机构的投资和管理机制抱怨一下, 不要总是让我这样的 "民科" 来做这样的事情了, 这是很富戏剧性的. 我有在国内著名高校实验室工作的朋友因为常常是在做只拿钱不干活的事情, 都开始怀疑人生的价值了.
分享到:
相关推荐
qtz40塔式起重机总体及塔身有限元分析法设计().zip
Elasticsearch是一个基于Lucene的搜索服务器
资源内项目源码是来自个人的毕业设计,代码都测试ok,包含源码、数据集、可视化页面和部署说明,可产生核心指标曲线图、混淆矩阵、F1分数曲线、精确率-召回率曲线、验证集预测结果、标签分布图。都是运行成功后才上传资源,毕设答辩评审绝对信服的保底85分以上,放心下载使用,拿来就能用。包含源码、数据集、可视化页面和部署说明一站式服务,拿来就能用的绝对好资源!!! 项目备注 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习,也适合小白学习进阶,当然也可作为毕设项目、课程设计、大作业、项目初期立项演示等。 3、如果基础还行,也可在此代码基础上进行修改,以实现其他功能,也可用于毕设、课设、作业等。 下载后请首先打开README.txt文件,仅供学习参考, 切勿用于商业用途。
美国纽约HVAC(暖通空调)数据示例,谷歌地图数据包括:时间戳、名称、类别、地址、描述、开放网站、电话号码、开放时间、更新开放时间、评论计数、评级、主图像、评论、url、纬度、经度、地点id、国家等。 在地理位置服务(LBS)中,谷歌地图数据采集尤其受到关注,因为它提供了关于各种商业实体的详尽信息,这对于消费者和企业都有极大的价值。本篇文章将详细介绍美国纽约地区的HVAC(暖通空调)系统相关数据示例,此示例数据是通过谷歌地图抓取得到的,展示了此技术在商业和消费者领域的应用潜力。 无需外网,无需任何软件抓取谷歌地图数据:wmhuoke.com
2023-04-06-项目笔记-第四百五十五阶段-课前小分享_小分享1.坚持提交gitee 小分享2.作业中提交代码 小分享3.写代码注意代码风格 4.3.1变量的使用 4.4变量的作用域与生命周期 4.4.1局部变量的作用域 4.4.2全局变量的作用域 4.4.2.1全局变量的作用域_1 4.4.2.453局变量的作用域_453- 2025-04-01
1_实验三 扰码、卷积编码及交织.ppt
北京交通大学901软件工程导论必备知识点.pdf
内容概要:本文档总结了 MyBatis 的常见面试题,涵盖了 MyBatis 的基本概念、优缺点、适用场合、SQL 语句编写技巧、分页机制、主键生成、参数传递方式、动态 SQL、缓存机制、关联查询及接口绑定等内容。通过对这些问题的解答,帮助开发者深入理解 MyBatis 的工作原理及其在实际项目中的应用。文档不仅介绍了 MyBatis 的核心功能,还详细解释了其在不同场景下的具体实现方法,如通过 XML 或注解配置 SQL 语句、处理复杂查询、优化性能等。 适合人群:具备一定 Java 开发经验,尤其是对 MyBatis 有初步了解的研发人员,以及希望深入了解 MyBatis 框架原理和最佳实践的开发人员。 使用场景及目标:①理解 MyBatis 的核心概念和工作原理,如 SQL 映射、参数传递、结果映射等;②掌握 MyBatis 在实际项目中的应用技巧,包括 SQL 编写、分页、主键生成、关联查询等;③学习如何通过 XML 和注解配置 SQL 语句,优化 MyBatis 性能,解决实际开发中的问题。 其他说明:文档内容详尽,涵盖面广,适合用于面试准备和技术学习。建议读者在学习过程中结合实际项目进行练习,以更好地掌握 MyBatis 的使用方法和技巧。此外,文档还提供了丰富的示例代码和配置细节,帮助读者加深理解和应用。
《基于YOLOv8的智能电网设备锈蚀评估系统》(包含源码、可视化界面、完整数据集、部署教程)简单部署即可运行。功能完善、操作简单,适合毕设或课程设计
插头模具 CAD图纸.zip
资源内项目源码是来自个人的毕业设计,代码都测试ok,包含源码、数据集、可视化页面和部署说明,可产生核心指标曲线图、混淆矩阵、F1分数曲线、精确率-召回率曲线、验证集预测结果、标签分布图。都是运行成功后才上传资源,毕设答辩评审绝对信服的保底85分以上,放心下载使用,拿来就能用。包含源码、数据集、可视化页面和部署说明一站式服务,拿来就能用的绝对好资源!!! 项目备注 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习,也适合小白学习进阶,当然也可作为毕设项目、课程设计、大作业、项目初期立项演示等。 3、如果基础还行,也可在此代码基础上进行修改,以实现其他功能,也可用于毕设、课设、作业等。 下载后请首先打开README.txt文件,仅供学习参考, 切勿用于商业用途。
《基于YOLOv8的智慧农业水肥一体化控制系统》(包含源码、可视化界面、完整数据集、部署教程)简单部署即可运行。功能完善、操作简单,适合毕设或课程设计
python爬虫;智能切换策略,反爬检测机制
台区终端电科院送检文档
e235d-main.zip
丁祖昱:疫情对中国房地产市场影响分析及未来展望
MCP快速入门实战,详细的实战教程
YD5141SYZ后压缩式垃圾车的上装箱体设计.zip
IMG_20250401_195352.jpg
DeepSeek系列专题 DeepSeek技术溯源及前沿探索.pdf