第1082章 数据银行!(2/2)
回车。
平板的散热风扇转了起来。屏幕上的光標闪了十八秒。
然后一个三维模型从对话框下方浮了出来——铝合金支架,四角加强筋,底部法兰固定孔。旁边跟著一串参数表:材料选型6061-t6,壁厚3.5mm,安全係数2.1。再往下是应力分析云图和一份三步加工工序卡。
苏哲把平板拿过来,放在手里翻了翻那个三维模型。模型可以用手指旋转和缩放。
“十八秒?”
“十八秒。正式版如果跑在四节点的算力网络上,预估不超过五秒。”
苏哲把平板放回桌上。
“这东西如果做出来,全世界一半的工程师会失业。”
陈默推了推眼镜:“不是失业。是升级。以前一个资深结构工程师做这个方案要两天。现在五秒钟出初稿,工程师的精力可以集中在审查和优化上。效率翻几十倍。”
“训练这个模型需要什么?”
“数据。”陈默把报告翻到第十一页,上面有一张曲线图,“模型的能力跟训练数据量的关係不是线性的——在达到一个閾值之前,模型的表现很平庸。越过閾值之后会出现能力涌现。根据我的估算,工业大模型的涌现閾值大约在一亿组高质量设计案例。”
“你现在手里有多少?”
“盘古造物系统自身积累的用户数据,大约两百万组。加上陈默研究所这些年攒的公开数据集,凑到三百万组顶天了。”
苏哲看了他一眼。
“差多少你自己心里有数。”
“差九千七百万组。”
这个数字在办公室里掛了几秒,像一个没人想碰的重物。
杨青被叫来的时候,脸上的水泡又起了一颗新的——上一颗刚好,这颗长在了嘴角另一侧。他现在两边嘴角对称地各有一个红点,像被什么东西叮过。
“数据共享倡议?”杨青听完需求,脑子转得快,“直接给十二万家企业发?”
“先发通知,摸底意愿。”苏哲说。
通知发出去的第二天,杨青在高新区管委会的办公室里对著电脑屏幕发呆。
回覆邮件一共六百一十三封。同意共享数据的——四十七封。其中三十九封来自京海本地企业,且大部分是已经跟市政府有深度合作关係的。
剩下五百六十六封,措辞五花八门,但核心意思一致:不给。
最有代表性的是寧波锦通精工的回覆——就是之前投诉数据溢出那家。措辞很文气,但字里行间扎得人疼:“我方对贵方系统的技术能力表示认可,但设计数据涉及客户商业秘密和企业核心竞爭力,无法对外共享。望理解。”
杨青把邮件匯总打了出来,走到苏哲办公室。
苏哲翻了三页就放下了。
“意料之中。”
“那怎么办?”杨青的水泡开始隱隱发疼。
“別急。先看看对面在干什么。”
对面在干什么,威尔逊当天夜里就发来了消息。
openai在旧金山总部召开了一场闭门发布会。受邀参加的只有三十家顶级製造业企业的cto和西门子数字工业部门的高管。发布会上展示了一个代號“forge”的工业版gpt原型——功能跟陈默演示的东西高度相似:自然语言输入產品需求,自动输出设计方案和加工路径。
但forge的演示效果比陈默的原型好得多。它不仅能生成单个零件的设计,还能根据装配关係自动生成整套机构的三维模型。
威尔逊的情报来源说,forge的训练数据量在四亿组以上。
四亿组。
数据来源是什么?西门子。
威尔逊在情报的最后附了一段话:“西门子nx和teamcenter的全球用户协议中,有一条隱蔽的数据使用条款(第17.3款)。该条款允许西门子將用户创建的设计文件用於產品改进、人工智慧模型训练及相关技术开发。该条款的表述含混,大部分用户在註册时未仔细阅读。”
苏哲看完这段话的时候是凌晨一点四十分。
他把情报传给了陈默。
陈默两分钟后回了一个表情包——一个卡通人物在吐血。
第二条消息:“四亿组。我手里三百万。这仗怎么打。”
苏哲没有回覆。
第二天他也没出现在办公室。第三天也没有。
杨青找了两次,林锐都说“书记在忙”。忙什么不知道。
第三天傍晚,苏哲从外面回来了。他的鞋上沾著一层灰——去过工地或者工厂。
他让林锐通知杨青、陈默和张志强,八点钟到会议室。
八点整。三个人坐定。
苏哲站在白板前面,拿起记號笔写了三个字。
**数据银行。**
三个人看著这三个字,脸上的表情各不相同。杨青困惑,陈默皱眉,张志强没表情——他永远是那副样子。
“企业不愿意给数据,因为他们觉得给出去是亏的。”苏哲说话的时候在白板上画了一个简单的示意图——一个双向箭头,左边写“企业”,右边写“盘古系统”。
“那就把它变成一笔划算的买卖。”
他在双向箭头上方標了一行小字:**数据进来→积分出去**
“每一组上传的设计数据,经过质量评级后折算成积分。积分可以兑换盘古系统的高级仿真功能——之前这些功能在收费计划表里標价每年三十万,现在用积分免费换。积分还可以兑换优先算力通道——四个超算节点建成后,排队等算力是常態,有积分的插队。”