科技资讯

OpenAI 发布下一代推理模型 o1 (传说中的Strawberry)

9/13/2024

OpenAI在2024年9月12日发布了一系列新的推理模型，命名为OpenAI o1。这些模型旨在通过更长时间的思考来解决复杂问题，相较于之前的模型，在科学、编程和数学等领域表现出更强的推理能力。

要点

新模型发布：OpenAI o1系列的第一个模型已经在ChatGPT和API中发布，这是一个预览版，预计将会定期更新和改进。
工作原理：这些模型被训练成在回答问题前花费更多时间思考，类似于人类的思考过程。它们通过训练学习优化思考过程，尝试不同的策略，并识别错误。
性能测试：在测试中，新模型在物理、化学和生物学的挑战性基准任务上的…

openai.com

OpenAI 和英伟达与 Oracle 构建全球最大算力集群，131,072 个 Nvidia Blackwell GPU，价值 52 亿美金

9/13/2024

Oracle宣布推出首个Zettascale云计算集群，搭载NVIDIA Blackwell平台，提供高达131,072个NVIDIA Blackwell GPU。该AI超级计算机提供2.4 ZettaFLOPS的峰值性能，是云中最大的AI超级计算机。

OCI Supercluster支持NVIDIA H100、H200和Blackwell GPU，提供不同规模和性能的AI计算能力。

此外，OCI Supercluster还提供低延迟网络和高性能存储选项。客户如WideLabs和Zoom正在利用OCI的高性能AI基础设施进行AI训练和推理。

要点

**Oracle推出首个Ze…

www.oracle.com

关注长尾才是 AI 正确的打开方式

8/21/2024

近期经济人的一篇名为“Artificial intelligence is losing hype”[1]文章提到，人工智能的概念正在褪去热度，投资者们开始担心人工智能可能无法带来他们期望的巨大利润。自从上个月股价达到顶峰以来，那些推动AI革命的西方公司的股票价格已经下跌了15%。越来越多的观察者开始质疑大型语言模型的局限性。

业界对 Scaling law 所能带来的性能改善达成共识同时，也基本确定了这条道路是无法直达通用人工智能（AGI) 的。被鸽了又鸽，迟迟没有推出的 GPT-5也让投资人怀疑大模型的天花板可能快到了。个人觉得 GPT-5大概率还是横向的提升，表现为更好的生成质量、对…

mp.weixin.qq.com

TurboEdit: 基于文本的即时图像编辑

8/19/2024

TurboEdit 在少步骤扩散模型的背景下解决了精确图像反演和松散图像编辑的挑战。该方案采用基于编码器的迭代反演技术，使反演网络以输入图像和上一步的重建图像为条件，以校正输入图像的下一个重建。

我们发现，通过详细的文本提示，可以在多步扩散模型中轻松实现松散控制。为了操作反转图像，我们冻结噪声图并修改文本提示中的一个属性，从而生成与输入图像相似的新图像，仅更改了一个属性。

迭代反演技术有助于实时进行逼真的文本引导图像编辑，在反演（一次性成本）中只需要8次功能评估（NFE），每次编辑需要4次NFE。该方法不仅速度快，而且明显优于最先进的多步扩散编辑技术。

要点

**精确图像反…

betterze.github.io

xAI 宣布发布 Grok-2 和 Grok-2 mini 的测试版

8/14/2024

** xAI 宣布发布 Grok-2 和 Grok-2 mini 的测试版，这两款模型在聊天、编码和推理方面展现了前沿能力，并在 LMSYS 竞赛榜单上表现出色。**

xAI正式推出了 Grok-2 和 Grok-2 mini 的测试版，这两款模型分别作为 Grok-1.5 的大型和小型升级，在多项标准测试中展现了显著的提升。Grok-2 在 LMSYS 竞赛榜单上以 “sus-column-r” 的名义参赛，其 Elo 得分超越了 Claude 3.5 Sonnet 和 GPT-4-Turbo。

Grok-2 和 Grok-2 mini 目前处于 𝕏 平台的测试阶段，预计将于本月晚些…

x.ai

扭转人工智能局面

8/9/2024

AI 的危险在于，它让你跳过思考，让机器填补思想的空白。我们需要 AI 使我们增加思考，而不是减少思考。我们每外包一个想法，就会错失一次成长的机会。

随着微软、Facebook、Google和苹果等公司的AI技术融合，人们越来越依赖于机器来“填补思考的空缺”。然而，作者提出了一个问题：我们是否可以利用AI来更多地思考，而不是减少思考？

文章提出了一系列的方法来“颠倒”我们对AI的依赖，转而使用AI来激发更深层次的思考。例如，可以让ChatGPT提出问题来帮助我们阐明写作的初衷和想法，而不是直接向AI提问。

作者鼓励读者在使用AI生成的内容时，保持原创性，不要直接使用AI的文本，而…

ia.net

OpenAI 发布 SearchGPT 原型

7/26/2024

OpenAI 正在测试一个名为 SearchGPT 的原型，旨在通过结合 AI 模型的强大功能与网络信息，为用户提供快速、及时且具有清晰和相关来源的答案。

SearchGPT 是 OpenAI 推出的一个新型 AI 搜索功能原型，目的是为了让用户能够更快捷、便捷地在网络上获取答案。该原型将直接以对话的形式回答用户的问题，并提供来自网络的最新信息，同时明确提供相关源的链接。用户可以进行后续问题的提问，AI 模型将在对话中保持上下文信息。

OpenAI 致力于与出版商和内容创作者合作，通过 AI 搜索高亮优质内容，同时为用户提供更多选择。SearchGPT 设计了直接引用和链接到出版商…

openai.com

人工智能在解决国际数学奥林匹克问题上达到银牌标准 - Google DeepMind

7/26/2024

DeepMind 的 AI 系统 AlphaProof 和 AlphaGeometry 2 首次实现了解决国际数学奥林匹克（IMO）问题的银牌水平，解决了四个出题。

DeepMind 宣布其人工智能系统 AlphaProof 和 AlphaGeometry 2 在国际数学奥林匹克（IMO）问题上的突破。AlphaProof 系统通过自我训练来证明数学陈述，它结合了预训练的语言模型和 AlphaZero 强化学习算法。AlphaGeometry 2 是一个改进的神经象征混合系统，用于解决几何问题。这两个系统在 IMO 2024 的问题上得分 28 分，相当于银牌水平。DeepMind…

deepmind.google

安德烈·卡帕蒂（Andrej Karpathy）宣布成立AI+教育公司 Eureka Labs

7/17/2024

安德烈·卡帕蒂（Andrej Karpathy）宣布成立了一个名为Eureka Labs的AI+教育公司，旨在构建一个与AI原生相结合的新型学校，通过生成AI辅助的课程材料，提供理想的学习体验。

安德烈·卡帕蒂宣布他将全职致力于他的新创立的公司Eureka Labs，该公司专注于AI与教育的结合。他认为，通过AI辅助的课程材料，可以弥补专家教师的不足，为学生提供一个类似与费曼级别的指导的学习体验。卡帕蒂强调，他们的目标是让任何人都能轻松学习任何东西，从而扩大教育的覆盖范围和深度。

Eureka Labs的首个产品是LLM101n，一门大学水平的课程，将指导学生通过自己训练AI。卡…

x.com

SEED-Story，一种能够生成多模态长故事的大型语言模型

7/14/2024

SEED-Story 包括与文本内容一致的图像，并且提供了用于训练和评估的大规模数据集 StoryStream。

SEED-Story 是一个多模态长故事生成模型，它能够根据用户提供的图像和文本生成包含连贯叙事和一致的角色与风格图像的故事。该模型基于 SEED-X，并且可以通过不同的开头文本生成不同的故事。SEED-Story 的训练分为三个阶段：第一阶段是使用 ViT 特征作为输入预训练 SD-XL 的去 tokenizer；第二阶段是通过下一个单词预测和目标图像的 ViT 特征之间的图像特征回归来训练 MLLM；第三阶段是将 MLLM 回归的图像特征输入去 tokenizer …

github.com

« 上一页 123 4 5 6 7 8 9 下一页 »