科技资讯

OpenAI 在 2024 年 5 月 13 日宣布了新的旗舰模型 GPT-4o,其中 “o” 代表 “omni”,意指全方位。GPT-4o 能够接受并生成文本、音频和图像的任意组合输入和输出,响应时间可低至 232 毫秒,平均为 320 毫秒,与人类对话的反应时间相当。该模型在文本、音频和视觉多模态处理方面取得了突破,特别是在非英语语言的文本处理和视觉、音频理解方面表现出色。GPT-4o 在传统基准测试上达到了与 GPT-4 Turbo 相当的文本、推理和编码智能水平,同时在多语言、音频和视觉能力方面创下了新的记录。此外,GPT-4o 的语言标记化能力显著提升,减少了多种语言的标记数量。

文章探讨了人工智能(AI)代理在自动化领域的作用及其对知识工作者和消费者生产力提升的潜力,分析了自动化平台的演进、AI在自动化中的角色、AI代理框架的发展、以及企业和构建者在部署和构建自动化解决方案时的考虑因素。

文章首先预测了AI助手的普及、人类在循环中的作用、自动化的复杂性、以及AI自动化的部署将遵循“爬行、行走、奔跑”的步骤。文章进一步探讨了自动化平台的演进,从早期的宏和工作流程自动化,到现在的机器人流程自动化(RPA)、iPaaS平台、低代码任务自动化平台以及垂直自动化方法。随后,文章分析了AI在企业自动化中的不同角色,包括RPA和任务自动化平台的当前状态,以及AI原生方法…

本文强调了大型语言模型(LLM)公司在技术上面临的搜索挑战,并预测了检索系统的未来发展趋势。

在计算机科学中,搜索被认为是最困难的技术问题之一,仅有少数产品如Google、Amazon和Instagram能够实现良好的搜索功能。随着大型语言模型(LLM)和支持它们的检索系统的爆炸性增长,每家LLM公司都需要内置世界级搜索功能,以确保其产品的正常运作。检索增强生成(RAG)系统通过向LLM提供相关信息来帮助其回应查询,这使得LLM的回答更加基于现实和相关的信息。即使新的LLM具有更长的上下文窗口,允许一次处理更大的输入,但检索系统在大多数应用中仍然不可或缺,因为它们能够处理多个文档版…

Isomorphic Labs 和 Google DeepMind 合作推出了 AlphaFold 3,这是一款能够预测生物分子结构和相互作用的人工智能模型,大幅提高了对蛋白质、DNA、RNA 以及药物分子等生命分子的理解,有望彻底改变生物学研究和药物发现。

AlphaFold 3 是由 Isomorphic Labs 和 Google DeepMind 开发的新一代人工智能模型,它能够以前所未有的准确性预测生命中所有分子的结构和相互作用。与现有的预测方法相比,AlphaFold 3 在预测蛋白质与其他分子类型的相互作用方面至少提高了 50%,对于一些重要的相互作用类别,预测准确性…

在与OpenAI的首席执行官Sam Altman的短暂交流中,他分享了关于人工智能(AI)未来发展的一些深刻见解。Altman认为,未来AI工具将比智能手机更深入地融入我们的日常生活。他向MIT技术评论描述了一个理想中的AI应用程序,即一个“超级能干的同事”,它了解用户的一切,包括每一封电子邮件和每一次对话,但并不像是用户的一部分。这样的AI能够迅速处理一些任务,对于更复杂的任务,它可以进行尝试,如果需要,还能回来向用户提出问题。

当前OpenAI的主要应用程序,如DALL-E、Sora和ChatGPT(Altman将其与即将推出的产品相比,称之为“非常愚蠢”),已经通过生成令人信服的文本和…

总结

本文讨论了生成式 AI 的经济学,重点关注了价值在生成式 AI 中的分布情况。

摘要

自从生成式 AI 的 “AI 之苹果时刻” 以来,发展的步伐并没有放缓。作者思考的一个关键问题是生成式 AI 中价值的分布情况,包括现在和未来。作者将 AI 栈分为三层:半导体、基础设施和应用。根据估算,半导体层目前占据了生成式 AI 收入的 83%,远高于云栈中半导体层的 10%。这是因为 Nvidia 在数据中心业务中获得了约 180 亿美元的收入,并且他们在该领域拥有 95% 以上的市场份额。在基础设施层和应用层,估计年收入分别为 100 亿美元和 50 亿美元。然而,云经济中最接近…

成立于不到两年前的Perplexity已经迅速成长为我日常频繁使用的产品,替代了我许多Google搜索的需求。目前,公司用户群已经扩展到数千万,年循环收入(ARR)超过2000万美元,同时在搜索领域与Google和OpenAI展开竞争。Perplexity最近完成了6300万美元的融资,估值超过10亿美元。投资者包括Nvidia、Jeff Bezos、Andrej Karpathy等。Nvidia的CEO Jensen Huang表示他几乎每天都在使用这个产品。

Perplexity的产品开发内幕如下:

  1. AI优先策略:公司通过AI解决企业发展的每个步骤的问题,员工被鼓励在打扰同事…

在过去两年中,生成性人工智能(AI)从根本上改变了开发者的工作环境,主要是作为开发环境中嵌入的工具。2022年,GitHub推出了Copilot,这是一种在编辑器中的自动补全编程伴侣,它能够提升开发者的生产力高达55%。如今,Copilot已经成为最广泛使用的AI开发工具。

2023年,GitHub进一步推出了GitHub Copilot Chat,这一工具释放了编程中自然语言的力量,使得开发者能够实时与他们的代码进行对话。去年在GitHub Universe上短暂展示后,GitHub现在通过GitHub Copilot Workspace的技术预览,重新构想了开发者体验的本质:Copilo…

InfoQ研究中心发布了《中国生成式AI开发者洞察2024》,旨在为行业从业者、希望进入该行业的个人或机构,以及关注生成式AI领域的大众人群提供清晰的行业洞察。

研究背景

  • 人工智能产业迅速发展,成为政策关注焦点。
  • 生成式AI作为产业创新的关键,与实体经济融合成为新生产力发展的引擎。
  • 报告通过桌面研究、专家访谈和用户调研,探讨了生成式AI开发者的特征、需求、企业建设升级路径等。

生成式AI开发者特征

  • 2023年全球人工智能市场收入同比增长20.7%,中国是发展最快的市场之一。
  • 生成式AI未来10年有望创造1.3万亿美元收入,国内政策提供支持。
  • 开发者普遍工…

微软在4月23日发布了其轻量级人工智能模型Phi-3 Mini的升级版本,这是计划中的三个小型模型系列的首个模型。Phi-3 Mini含有38亿个可测量参数,相较于GPT-4等大型语言模型,它在更小的数据集上进行了训练。目前,该模型已在Azure、Hugging Face和Ollama平台上提供。除了Phi-3 Mini,微软还计划推出Phi-3 Small(7B参数)和Phi-3 Medium(14B参数)两个版本。

微软曾在去年12月发布Phi-2,其性能与大型型号如Llama 2相当。公司声称,新版本的Phi-3在性能上超越了Phi-2,且响应速度接近于它规模大10倍的模型。

微软A…