AI知识库|大模型知识库|智能体开发|53AI - 53AI-AI知识库|大模型知识库|大模型训练|智能体开发

分类：

标签：

断网也能用！贾扬清团队推出端侧模型Chrome插件，arXiv/B站/吃瓜一件搞定

贾扬清团队推出了一款名为Elmo的Chrome插件，支持端侧模型，即使在断网情况下也能使用。Elmo插件利用本地模型Gemini nano，大小为12MB，提供快速生成总结、摘要和亮点的功能，支持精读arXiv和PDF论文，以及国内外新闻速览。此外，Elmo插件还具备视频时间轴分段总结功能，方便用户快速浏览视频内容。

发布日期： 2024-07-20 08:04:44

查看详情
VLLM与PagedAttention实现快速大模型推理服务

本文介绍了一种名为 PagedAttention 的新型注意力算法和基于该算法构建的大模型服务系统 vLLM。PagedAttention 算法通过在非连续的分页内存中存储连续的键值对，提高了内存管理效率。vLLM 系统通过块级内存管理和抢占式请求调度，实现了高效的内存利用，显著提高了 LLM 的吞吐量。实验结果表明，vLLM 在保持相同延迟水平的情况下，将吞吐量提高了 2-4 倍。

发布日期： 2024-07-20 08:04:19

查看详情
基于条件扩散模型的策略生成：Make-An-Agent 方法

Make-An-Agent 是一种基于条件扩散模型的策略生成新方法，由马里兰大学、清华大学等机构的研究人员提出。该方法通过自编码器压缩策略网络参数，并在多任务设置、新任务处理和环境随机性抵抗方面展现出良好性能。

发布日期： 2024-07-20 08:01:23

查看详情
【开源】 53AI Hub，跨平台的智能体发布与运营平台

无缝对接字节扣子、腾讯元器、Dify、FastGPT、RAGFlow等智能体开发平台，让开发者和企业能够快速搭建生产运营级的 AI门户，无需复杂的技术整合流程。即使是没有技术背景的人员，也能轻松参与智能体发布和运营，极大降低了 AI 应用落地的门槛。

跨平台接入

一键接入Coze、Dify 等平台

个性化运营

自定义界面及用户权限

企业级架构

支持高并发及企业级安全

私有化部署

支持云主机和本地一键部署

了解更多信息>>

从零预训练LLAMA3的完整指南：一个文件，探索Scaling Law

本文介绍了如何从零开始预训练LLaMA3语言模型，包括模型构建、训练数据加载、评估方法和分布式训练。作者通过Huggingface的官方LLaMA3模型进行HellaSwag评估，并开源了相关代码。

发布日期： 2024-07-20 08:00:58

查看详情
百度AICA再开课！已为业界输送410名首席AI架构师

百度AICA首席AI架构师培养计划第八期开学典礼成功举办，90位企业CTO、科学家及技术高管学员将进行为期半年的AI大模型研发和应用实践学习，旨在培养高端复合型AI人才，推动大模型应用落地。

发布日期： 2024-07-20 07:59:37

查看详情
OpenAI 推出小型人工智能模型 GPT-4o mini替代GPT-3.5

OpenAI 推出了一款新的小型人工智能模型 GPT-4o mini，旨在降低成本和能源消耗，同时提供高性能的语言理解和推理能力。该模型在价格上比 GPT-3.5 更具竞争力，并且在多任务语言理解测试中表现优异。GPT-4o mini 支持文本和视觉输入，未来将扩展到更多模态，并且已经集成到 ChatGPT 的不同版本中。

发布日期： 2024-07-20 07:58:54

查看详情
【阿里AgentScope框架】详解AgentScope中的消息管理和分发模块（上）

本文详细介绍了阿里AgentScope框架中的消息管理和分发模块，包括消息基类MessageBase的初始化函数和参数，以及消息类Msg的继承关系和实现方法。

发布日期： 2024-07-20 07:58:34

查看详情
集体智慧大模型：百万混合专家模型提升大模型效果

DeepMind研究人员开发了一种新型大模型架构MoME，通过混合百万级别的专家来提升模型的推理效果和计算效率。MoME架构利用PEER层改进现有的Transformer架构，减少计算占用量，并通过增加专家数量来提高性能。

发布日期： 2024-07-20 07:58:18

查看详情
大白话！解析大模型原理！

本文以非技术性语言解释了大型语言模型（LLM）的工作原理，包括词向量、Transformer模型和训练方法。文章通过类比和实例，帮助读者理解这些模型如何通过词向量在高维空间中表示单词，并解释了为何需要大量数据来训练这些模型。

发布日期： 2024-07-19 21:53:06

查看详情
RB-SQL：利用检索LLM框架处理大型数据库和复杂多表查询的NL2SQL

RB-SQL框架通过三个模块：Table-Retriever、Column-Retriever和SQL-Skeleton-Retriever，利用大型语言模型（LLM）和Dense Passage Retrieval (DPR)模型来提高处理大型数据库和复杂多表查询的NL2SQL任务的性能。

发布日期： 2024-07-19 21:51:09

查看详情
AGIX ETF 上线：构建 AI-native 的投资工具

2024年7月18日，KarneShares在纳斯达克交易所上线了追踪AGIX指数的ETF产品$AGIX，该指数被称为AI时代的'Nasdaq 100指数'，包含硬件、基础设施、应用三个领域，筛选出50家左右与AI高耦合度的公司，帮助投资者感受AI价值的流动。$AGIX ETF的上线标志着AI-native成为新的价值导向，为投资者提供了一个有前瞻视角、能有效跟踪AI趋势变化的工具。

发布日期： 2024-07-19 21:47:39

查看详情
GPT-4o mini：OpenAI 全新更快速模型现已在 Azure AI（国际版）发布

GPT-4o mini 是 OpenAI 发布的全新模型，现已在 Azure AI（国际版）上线。该模型在多任务语言理解方面表现优异，成本降低，支持多语言，提供128K上下文窗口。Azure AI 还提供了内容安全功能，包括提示词屏蔽和受保护内容检测。

发布日期： 2024-07-19 21:47:24

查看详情
关于垂直领域大模型的探索和尝试

本文探讨了垂直领域大模型的特点、优势和挑战。垂直领域大模型是经过特定领域知识训练和优化的模型，具有领域专业性、高质量输出和特定任务效果优势。但同时，它们也面临准确性要求高、知识库维护复杂和适用性限制等挑战。文章还讨论了对齐增强等解决方案。

发布日期： 2024-07-19 20:05:16

查看详情

上一页 1...444 445446447 448...630 下一页

了解更多

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

大家都在问

AI时代下的软件升级：大模型如何让考勤系统听懂人话？

2025-05-27

AI搜索+DeepResearch=？

2025-05-26

大模型 Agent 就是文字艺术吗？

2025-05-23

今天的Agent，就是十年前的小程序？

2025-05-23

从Agent到Agentic AI：大语言模型真的在向"智能体"进化吗？

2025-05-23

震惊，大模型推理的两个阶段，速度竟然相差140倍！一个实验告诉你为什么大模型推理时需要PD分离？

2025-05-18

推理大模型与普通大模型的区别是什么？

2025-05-18

2025AI 圈的 “新物种”：MCP、Fellou、Manus、Browser等都是啥？和纯AI大模型有何区别？如何选？

2025-05-17

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部