我要投稿

AI数据处理实战：如何从每个标题中提取品牌名称？

发布日期：2024-06-09 03:37:13 浏览次数： 2612

作者：白领服务工作室

微信搜一搜，关注“白领服务工作室”

有时，我们需要从一小段文本内容中提取名牌名称。如果是人工来挑选，在文本较多时，就会显得吃力费时。这时，使用AI大模型来帮助我们提取，是非常高效的。例如下面的例子：

以上是表格的截图，A列的10行，也就是10个单元格，从每个单元格的文本中提取品牌的名称。上面只是10个单元格，如果是几百个或几千个单元格，需要提取品牌名称，会是非常麻烦的事情。如何使用AI大模型来处理呢？

对于使用大模型来说，prompt是非常重要的，不同的prompt，大模型会给出不同的结果。所以，调试出最优的prompt，得到我们所需的结果，才是使用大模型最重要的环节。

1、使用通义大模型

我们调试几次后得到下面的prompt：

任务：提取表格中10个单元格中出现的所有品牌的名称

要求如下：

1、每个单元格提取的结果输出为一行，表格有10个单元格，输出结果也是10行，每行结果前加上1、2、3的序号；

2、如果某个单元格没有品牌名称，则输出无；

3、如果某个单元格有多个品牌名称，请全部提取，并输出为一行，同用中划线将多个品牌名称分隔开。

得到的结果如下所示：

我们看到，有一些小错误：

第3行：优衣库后面错误加上了一些文字

第8行：其实是没有品牌名称，错误提取了一些文字

第10行：多个品牌名称的问界，后面错误加上了汽车

2、使用文心一言大模型

文心大模型无法上传表格，这里直接在prompt里面加上文本，但是如果是大量文本，放在prompt里面，会突破token上限，此时最好直接调用API来完成。

我们调试几次后得到下面的prompt：

文本内容如下：

奥克斯电蚊拍充电式家用强力锂电池灭蚊灯二合一驱蚊神器打苍蝇拍

全棉时代洗脸巾擦脸巾平纹M码洁面巾纯棉柔巾100抽*1包洗面巾

优衣库男装女装凉感大师T AIRism宽松圆领T恤五分袖短袖465185

湿厕纸便携小包10片X1包擦洁厕湿纸巾女性经期湿巾旅行家用维达

防晒服拉夏贝尔女2024夏季新款高倍防晒长袖修身显瘦百搭时尚外套

【重磅】一键接入扣子、Dify，FastGPT等开发平台

立即开通>>

企业内部AI 先行者已通过扣子、Dify 等智能体开发平台积极探索 "人 + AI" 的效率革新。这些应用大多局限于小范围应用，基于此，我们打造一款开箱即用的 AI 门户-53AI Hub，让企业实现从 "场景级效率优化" 到 "企业级生产力重构" 的跨越....

飞科剃须刀男士电动刮胡刀官方旗舰店正品送男友父亲节礼物送爸爸

三只松鼠手撕面包1000gX1箱零食早餐首选休闲食品三只松鼠蛋糕点心吐司

意式极简床头柜2024新款轻奢高级感实木简约现代卧室床边保险柜子

虎牌保险柜箱智能床头柜一体家用防盗无线充电现代多功能2024新款

我喜欢心心相印的纸巾，你喜欢百果园的水果，他喜欢问界汽车

要求如下：

1、从以上10行文本中出现的所有品牌的名称；

2、每一行文本提取的结果输出为一行，每行结果前加上1、2、3的序号；

3、如果某一行文本中没有品牌名称，则输出无；

4、如果某一行文本中有多个品牌名称，请全部提取，并输出为一行，同用中划线将多个品牌名称分隔开。

得到的结果如下所示：

我们看到，只有1个小错误：

第10行：多个品牌名称的问界，后面错误加上了汽车

相比通义，文心的结果更好。

3、使用豆包大模型

使用的Prompt同文心一言，得到的结果如下：

我们看到，结果完全符合我们的需求，没有任何小错误。看来，豆包的理解能力更强大啊！

总结

通过上面的案例，我们可以得到下面的经验：

1、调试好prompt最重要。

2、不同的大模型，可能会得到的结果，所以，要尝试不同的大模型。

3、在数据量较多时，最好使用API调用。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-05-27

AI在药物研发中的应用：从“试错模式”转向“计算驱动”

2025-05-27

Z Product｜前麦肯锡员工创办AI尽职调查公司，专注原始数据收集，赋能企业24小时完成尽调，获数千万美元融资

2025-05-27

开源协作新神器Docmost：团队知识管理的高效低成本解决方案！

2025-05-27

AI问答系统的挑战之语义鸿沟与知识盲点，让大模型理解行业黑话

2025-05-26

飞书知识问答｜企业级知识管理进入AI时代

2025-05-26

企业知识管理体系与应用

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

大家都在问

大模型落地的 “确定性答案”，藏在知识库里？

2025-05-26

我最近是怎么用 Obsidian 给自己“解压”的？

2025-05-14

为什么Data Agent将成为企业未来三年胜负手？

2025-05-07

你是否有这样的困惑：AI大模型交流了好几天，企业还是不知道做什么？

2025-05-07

人人用AI ≠ 组织AI化，什么是智能组织？

2025-04-27

从三种类型“企业知识”看企业生成式AI如何应用落地？

2025-04-20

腾讯IMA知识库高阶玩法之六，99%的人不知道：AI时代书还能这么读？

2025-04-17

腾讯文档 “AI搜索” PK 腾讯IMA！2个不同的AI产品框架，哪个产品经理更厉害？

2025-04-17

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB