科技资讯

OpenAI 训练了一个基于 GPT-4 的模型 CriticGPT,用于帮助人类训练者在强化学习从人类反馈(RLHF)过程中发现 ChatGPT 输出代码中的错误,并提高了训练者捕捉这些错误的能力。

摘要

OpenAI 发布了一篇研究论文,介绍了他们基于 GPT-4 训练的一个新模型 CriticGPT,它能够帮助人类训练者识别 ChatGPT 生成代码中的错误。

实验结果表明,使用 CriticGPT 辅助的训练者在评估 ChatGPT 代码时,比没有辅助的训练者表现得更好,能够发现更多问题。

CriticGPT 通过 RLHF 方法进行训练,但与 ChatGPT 不同,它在…

Jina Reranker v2 专为Agentic RAG(Retrieval-Augmented Generation)系统设计,支持多语言检索、功能调用、代码搜索和超快的文档处理速度。

Jina Reranker v2 是 Jina AI 推出的最新一代reranker模型,它支持超过100种语言的多语言检索,能够进行功能调用和代码搜索,同时提供了6倍于前一代的速度提升。

该模型使用了 Flash Attention 2 技术,优化了注意力机制,使得模型在保持精度的同时大幅提升了文档处理速度。

Jina Reranker v2 的训练过程包括四个阶段:首先使用英文数据进行…

Anthropic 发布了 Claude 3.5 Sonnet,这是 Claude 3.5 系列模型的首个版本,它在智能、速度和成本效率方面都取得了显著提升,并且在多个评估中超越了同行模型和 Claude 3 Opus。

Claude 3.5 Sonnet 是 Anthropic 推出的新型号,它在渐进式评估中显示出超越前代模型和竞争对手的能力。该模型现在可以在 Claude.ai 和 iOS 应用上免费使用,对于订阅了 Claude Pro 和 Team 计划的用户,提供了更高的使用限额。此外,Claude 3.5 Sonnet 也可以通过 Anthropic API、A…

苹果公司推出了全新的人工智能系统——Apple Intelligence,该系统集成于iPhone、iPad和Mac,通过生成模型与个人上下文相结合,提供高度个性化和隐私保护的智能辅助功能。

苹果公司在2024年6月10日宣布推出Apple Intelligence,这是一款集成在iOS 18、iPadOS 18和macOS Sequoia操作系统中的个人智能系统。该系统利用苹果自研芯片的计算能力,结合生成模型,能够理解和创建语言和图像,跨应用程序执行任务,并根据用户的个人上下文简化日常操作。Apple Intelligence强调隐私保护,通过在设备上处理大部分数据和引入Priva…

OpenAI 推出了专为教育机构设计的经济型 AI 解决方案 ChatGPT Edu,旨在帮助大学校园范围内的学生、教职员工、研究人员和行政运营负责人负责任地使用人工智能。

OpenAI 宣布推出 ChatGPT Edu,这是一种针对大学的经济型 AI 产品,旨在负责任地将 AI 引入校园。该产品由 GPT-4o 驱动,支持文本和视觉理解,并具备数据分析等高级功能。ChatGPT Edu 提供企业级安全性和控制权限,并且价格适中,适合教育机构。OpenAI 观察到包括牛津大学、宾夕法尼亚大学沃顿商学院、德克萨斯大学奥斯汀分校、亚利桑那州立大学和哥伦比亚大学在内的一些大学在使用 Ch…

Mistral AI 发布了 Codestral,这是一款开源的代码生成 AI 模型,能够支持 80 多种编程语言,并通过 API 提供代码交互和完成功能,旨在提高开发者的效率和代码质量。

Mistral AI 宣布推出了其首款代码模型 Codestral,这是一款开源的、针对代码生成任务设计的生成 AI 模型。Codestral 支持超过 80 种编程语言,包括 Python、Java、C、C++、JavaScript 和 Bash 等流行语言,以及 Swift 和 Fortran 等特定语言。该模型旨在帮助开发者通过共享指令和完成 API 端点更高效地编写和交互代码,提升他们的…

** 华盛顿大学研究团队开发了一种人工智能系统,可以让佩戴耳机的用户通过简短地看向某个说话的人来“注册”他们,之后系统能够实时取消环境中的其他声音,只放通所选说话者的声音,即使用户在嘈杂的环境中移动或不再面对说话者。**

这种名为“Target Speech Hearing”(TSH)的系统,是由华盛顿大学的研究团队开发的。用户只需佩戴带有麦克风的普通耳机,轻触按钮并向目标说话者方向转动头部几秒钟,系统便能识别并学习目标说话者的声音特征。

在实验中,21名测试者对于系统隔离出的目标声音的清晰度评价高出未经过滤的环境声音的平均水平近一倍。该系统目前只能一次性注册一个说话者,并且在注册过程中…

Anthropic公司报告了一项重大进展,成功解读了其部署的大型语言模型Claude Sonnet内部如何表示数百万个概念,这是对现代、生产级别大型语言模型内部工作机制的首次详细了解。

在2024年5月21日,Anthropic宣布对大型语言模型内部工作机制的深入理解。该公司成功识别了其中一款大型语言模型Claude Sonnet内部如何表示数百万个概念,这是对现代、生产级别大型语言模型内部的首次详细了解。

这一发现可能有助于未来提高AI模型的安全性。目前,AI模型通常被视为黑箱,其内部状态是一系列难以解释的神经元激活值。Anthropic通过“字典学习”技术,将这些神经元激活模…

结论

李飞飞强调,无论参数多少,大模型都不具备主观感觉能力。

摘要

知名AI研究者李飞飞及其同事John Etchemendy教授在一篇文章中探讨了大模型是否具有感觉能力的问题。文章指出,尽管大型语言模型(LLMs)在多个方面表现出超人类智能,但它们并不具备感觉能力。李飞飞通过多个例子说明,LLMs只是能够产生文本序列,而不会真正体验到饥饿、疼痛等感觉,因为它们缺乏生理结构。她认为,LLMs的工作原理是基于概率性地完成任务,而不是基于主观经验。

文章还提到,有些人认为AI已经获得了感觉能力,因为它能够报告类似于主观经验的信息,但李飞飞和Etchemendy教授驳斥了这一观点…

这篇文章《Product-Led AI》由Seth Rosenberg撰写,探讨了技术新时代中,如何投资和构建以AI为主导的产品。文章中,作者表达了一种观点:尽管很多投资者热衷于支持当下的“铲子和镐头”类型的企业,如NVIDIA和基础模型公司,但更需要有人愿意冒险去创造能够改变人们工作与生活的AI产品。

Seth Rosenberg认为,成功将AI能力整合到受人们喜爱的产品中的创业者,将有机会捕获巨大的价值。他提到,任何时代最战略性的优势就是你的产品能与多个系统同存,并收集所有通过产品传递的数据。他举例了一些企业家,如Tome的Keith Peiris和Henri Liriani,以及Run…