2024年12月20日,Anthropic公司今日发布了一份名为《构建有效代理》的白皮书,总结了过去一年中与多个行业团队合作构建大型语言模型(LLM)代理的经验。白皮书强调,成功的实施并非依赖于复杂的框架或专用库,而是通过简单、可组合的模式实现。
Anthropic指出,代理可以被定义为完全自主的系统,也可以是遵循预定义工作流的更规范的实现。公司区分了工作流和代理:工作流是通过预定义的代码路径协调LLM和工具的系统,而代理则是LLM动态指导自身流程和工具使用的系统。
白皮书建议,在构建LLM应用时,应寻找最简单的解决方案,并只在必要时增加复杂性。代理系统通常以延迟和成本换取更好的任务性能,…
在量子计算领域,谷歌量子人工智能团队取得了突破性进展,宣布了其最新的量子芯片——Willow。这款芯片不仅在多个性能指标上展现出了最先进的性能,而且在量子错误校正和性能方面取得了重大成就,为构建实用、大规模的量子计算机铺平了道路。
Willow芯片的首个重大成就是其能够随着量子比特(qubits)数量的增加而指数级降低错误率。这一成就解决了量子错误校正领域近30年来的关键挑战,实现了所谓的“低于阈值”的错误率降低,这对于展示量子错误校正的实际进展至关重要。
其次,Willow芯片在不到五分钟的时间内完成了一个标准基准计算,而这一计算对于当今最快的超级计算机来说需要10^25年,即10 se…
2024年12月9日,人工智能领域迎来了一个重大突破——OpenAI正式推出了Sora,一款能够根据文本生成逼真视频的模型。Sora的问世标志着AI技术在理解和模拟现实世界方面迈出了重要一步,为未来与物理世界互动的模型开发奠定了基础。
Sora Turbo:速度与效率的飞跃 OpenAI此次推出的Sora Turbo版本在速度上有了显著提升,比2月份预览的模型快得多。Sora Turbo作为独立产品在Sora.com上线,面向ChatGPT Plus和Pro用户开放。
全新界面,更多功能 Sora带来了一系列新功能,用户现在可以生成高达1080p分辨率、最长20秒的视频,并…
Claude 3.5 Sonnet在编码领域实现了显著提升,继续保持行业领先地位。而Claude 3.5 Haiku则在成本和速度与前代Haiku相似的情况下,性能与Claude 3 Opus相当,甚至在许多评估中超越了它。
此外,Anthropic公司还推出了一项开创性的公测功能——计算机使用能力。开发者现在可以指导Claude像人类一样使用计算机,包括查看屏幕、移动光标、点击按钮和输入文本。Claude 3.5 Sonnet是首个提供这项公测功能的AI模型。尽管这项功能目前还处于实验阶段,可能会遇到一些困难和错误,但Anthropic公司希望通过开发者的反馈快速改进。
一些公司如Asa…
Sequoia刚刚发布的关于生成式 AI 的年度报告, 报告指出随着生成式 人工智能(AI)技术的飞速发展,我们正迎来一个全新的时代——推理时代。在这个时代,AI将不再仅仅依赖于快速的模式匹配,而是能够进行深入的思考和推理,解决更复杂的问题。
过去两年,生成性AI市场的基础层已经稳定下来,形成了以微软/OpenAI、亚马逊/Anthropic、Meta和谷歌/DeepMind等为主要玩家的市场结构。这些巨头的竞争仍在继续,但他们的稳定为AI的进一步发展奠定了基础。
现在,焦点转向了推理层的开发,这一层的目标是让AI在推理时能够进行深思熟虑的推理和问题解决。OpenAI的最新模型o1(也称为…
加州门洛帕克,2024年9月26日 —— Meta公司在位于加州门洛帕克的总部向媒体展示了其首款增强现实(AR)眼镜Orion。尽管Orion眼镜目前尚未上市,但其展示的技术令人印象深刻,预示着智能手机之后新一代计算平台的到来。
Orion眼镜外观低调,采用黑色框架,但内部集成了复杂的高科技。这款眼镜内置了定制的Micro LED投影器,通过硅碳化物镜片中的波导技术,将图像直接投射到用户视野中。硅碳化物因其耐用性、轻质和高折射率而被选用,以提供更宽广的视野。
Meta公司CEO马克·扎克伯格将Orion视为未来沟通和与AI交互的主要工具。在演示中,Orion展示了其生成式AI能力,…
2024年9月19日 — Qwen团队今日宣布推出Qwen2.5,这是迄今为止最大规模的开源语言模型之一。Qwen2.5系列包括通用、编程和数学优化的模型,覆盖从0.5B到72B不同参数规模,为开发者和研究人员提供了前所未有的灵活性和性能。
全面升级,性能卓越
Qwen2.5在最新的大规模数据集上进行了预训练,涵盖了高达18万亿个token,显著提升了模型的知识获取、编程和数学处理能力。此外,Qwen2.5在遵循指令、生成长文本、理解结构化数据和生成结构化输出方面也展现了卓越的性能。
专家模型,专注领域
Qwen2.5-Coder和Qwen2.5-Math作为专家模型,…
本周是AI和机器人领域的重要一周,众多公司发布了最新动态。
OpenAI发布“o1”模型:OpenAI正式推出了名为“o1”的模型,也称为Project Strawberry/Q*。这个模型通过强化学习和链式思维在回答之前进行“思考”,预示着与GPT-4完全不同的提示方式。
苹果推出iPhone 16的AI功能:苹果宣布了iPhone 16的Apple Intelligence功能,这将极大地推动消费者AI的普及。特别引人注目的是AI能够访问iPhone的相机,实现对周围环境的“视觉智能”。
Google DeepMind的机器人AI系统:Goo…
Yoto 是一家专注于为儿童提供不依赖屏幕时间的内容的英国初创公司。通过其音频平台,Yoto 为儿童提供了一个更安全的内容消费空间,这个空间不包含任何麦克风、摄像头或广告。
Yoto 的产品独特之处在于,它允许儿童自己选择内容,每张智能卡都是根据儿童发展的需求设计的, 融入了蒙特梭利教育原则。儿童可以根据自己的年龄组选择一张卡片,插入他们的设备中,然后播放音频内容。
Yoto 提供的内容非常全面,包括来自 Beatrix Potter、迪士尼、Julia Donaldson、Ladybird、PAW Patrol 等创作者的内容。列出的类型也非常广泛,包括睡前故事、音乐、学习和冒险故事。 …
自动化提示工程(Automated Prompt Engineering, APE)是一种用于自动化生成和优化大型语言模型(LLM)提示的技术,目的是提高模型在特定任务上的性能。APE的核心思想是将提示工程的过程自动化,类似于传统机器学习中的自动化超参数优化。
APE的工作原理包括以下几个关键步骤:
初始提示:从一个初始提示开始,将其和数据集一起发送给目标LLM,生成基于数据集的响应。
评估响应:使用标记数据集的真值来评估LLM生成的响应,确定模型的性能。
优化提示:基于评估结果,优化器LLM会提出新的提示。
迭代过程:重复生成…