微信扫码
添加专属顾问
我要投稿
据路透社报道,来自三个不同科学机构的六名中国研究人员,通过Meta所发布的开源模型Llama的早期版本,开发了名为“ChatBIT”的人工智能应用。
其中两位研究人员来自军事科学机构,研究人员使用Meta于2023年2月发布的Llama 2大型语言模型进行了微调,构建了一个聚焦军事的AI工具,旨在收集和处理情报,为作战决策提供准确可靠的信息。
1:学术研究的合理性
将研究成果以论文形式发表,彰显了科研的本质。这种做法不仅是对技术的探索,也是大模型在不同领域应用的一次良好尝试。开放的学术环境应该欢迎这样的创新,无论其出发点如何。
2:Meta的反应与政策
目前,Llama模型的权重是开源的,Meta在技术上无法限制其使用。但它从授权形式上设置了一些限制,比如要求拥有超过7亿用户的服务向其申请许可,并禁止将这些模型用于“军事、战争、核工业或间谍活动”等受美国国防出口管制的领域,但这在一定程度上展现了科技霸权。
既然选择了开源,就应该允许全球不同国家和领域的研究者进行探索,这才符合互联网的开放精神,难道只能美国才能研究?
3:Meta为何选择开源
开源背后必然有其动机,扎克伯格曾表示,Meta起步较晚,缺乏竞争优势,因此选择开放源代码,以从周围生态中获益。
这种策略显然有助于Meta的股票上涨,且带动了众多基于Llama的下游服务商建立生态,赚翻了!
4:大模型的真正开源
虽然Llama的权重是开源的,但训练方法和数据并未开放,因此这种开源形式实际上是“伪开源”。Meta仍然掌握着技术的核心和优势。在缺乏广泛生态利益或对下游行业的控制时,完全开源几乎是不可能的。
即使技术上可行,普通开发者也难以复刻这些超大规模模型,巨大的成本与潜在的版权问题都是障碍,Meta不可能将技术优势给予和他一样规模的公司。
OSI标准化组织定义了大语言模型开源标准OSAID,动机是好的也是单纯的,但估计根本不具备可实施性。
5:国内大模型的发展现状
通过上图可以推测,目前许多企业在大语言模型的应用上策略不明确,动机令人质疑。若继续以当前方式推进,大多数企业可能因资金不足而消亡。
未来,存活的大模型企业应具备以下特点:一是财力雄厚,二是技术积累深厚,三是领导者具备强烈的技术洞察力。例如,百度和科大讯飞在自然语言处理(NLP)领域已有一定基础,李彦宏在无人驾驶领域的持续探索也显示了对科技发展的渴望。
国内未来可能仅需2至3家大模型企业,盲目烧钱毫无意义。即使在利用开源技术的过程中,企业也应将大模型技术融入自身产品中,例如百度地图和百度文库的集成。通过不断打磨与实践,才可能实现真正的技术突破。
通义千问不得不提,在推特上经常看到很多国外的从业者对于它的评测,开源做的很不错,可见对于大模型发展来说,领导人的智慧很重要,他们可能看的更远。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-05-27
Dify工具插件开发和智能体开发全流程实战
2025-05-27
一个让工作效率翻倍的AI神器,Cherry Studio你值得拥有!
2025-05-27
Docext:无需 OCR,本地部署的文档提取神器,企业数据处理新选择
2025-05-26
太猛了,字节把GPT-4o级图像模型开源了!
2025-05-26
Qwen3硬核解析:从36万亿Token到“思考预算”
2025-05-26
蚂蚁集团开源antv的MCP服务:AI智能体与数据可视化的桥梁如何搭建?
2025-05-26
MinerU:高精度纸媒文档解析与数据提取一站式解决方案
2025-05-26
顶级开发者默默换掉了基础大模型
2024-07-25
2025-01-01
2025-01-21
2024-05-06
2024-09-20
2024-07-20
2024-07-11
2024-06-12
2024-12-26
2024-08-13
2025-05-26
2025-05-25
2025-05-23
2025-05-17
2025-05-17
2025-05-17
2025-05-16
2025-05-14