科技资讯

随着生成性人工智能(GenAI)应用的爆炸性增长,开发者和投资者开始关注如何利用先进技术为最终用户提供服务。这一趋势得益于过去24个月内行业建立的平台基础设施的改进,它简化了托管、微调、数据加载和内存管理等操作。然而,由于AI代理的快速发展,很少有假设能够长时间保持有效。AI代理作为自主执行多步任务的实体,正在成为开发者构建应用的核心抽象。这促进了更快的应用开发速度,并为平台层创造了新的机会。

AI代理的出现进一步加速了应用的构建速度,并对基础设施提出了新的要求。目前,代理的最佳表现依赖于高度定制,开发者正在努力将这些技术应用于其当前状态下的适用场景。尽管存在限制,如错误率、管理需求、带宽、…

OpenAI与洛斯阿拉莫斯国家实验室(LANL)正在合作研究人工智能在生物科学研究中的安全应用。这一合作旨在评估前沿AI模型的能力,特别是在实验室物理环境中,通过多模态能力如视觉和语音协助科学家完成任务。

这项合作遵循了白宫的一项行政命令,要求能源部国家实验室帮助评估前沿AI模型的能力。

OpenAI已经在医疗领域展现了其技术的应用,例如Moderna使用OpenAI的技术来辅助临床试验的数据分析,而Color Health则利用GPT-4o构建了一个辅助医疗提供者做出基于证据的决策的副驾驶。

OpenAI和LANL的评估研究将是首次考虑AI生物安全评估的实验,它将基于OpenAI关于生…

本文分享了在过去一年中使用大型语言模型(LLMs)进行产品开发的经验教训,涵盖了从实战技巧、日常运营到战略规划的各个方面。

在过去的一年里,大型语言模型(LLMs)已经成为实际应用中的一个重要工具。随着LLMs的不断改进和成本的降低,预计到2025年将有2000亿美元的投资。

LLMs的API使得它们更加易于访问,允许非机器学习工程师和科学家也能够将智能功能融入到他们的产品中。尽管进入门槛降低,但构建有效且超越示例的产品仍然具有挑战性。

作者分享了以下几个方面的经验:

  • 实战技巧:包括提示工程(prompting)、信息检索/生成(RAG)、调优和优化工作流程、评估…

苹果公司在人工智能领域倡导了一种与AI极大主义相对立的策略,认为生成式AI应该作为基础设施而非平台或产品,强调将AI集成到设备中,以提供新的功能和能力。

苹果公司即将推出的人工智能功能,预计将在秋季分阶段推出,但只能在支持本地处理的iPhone 15 Pro上使用。这些功能包括大型语言模型(LLM),但不提供直接与模型交互的聊天机器人。苹果的策略是将AI作为技术嵌入到系统中,利用设备上的用户上下文来提供个性化的功能,而不是作为一个全能的解决方案。苹果的模型将不会像Gemini那样提供不合理的建议,因为它们不会回答开放式问题,而是通过特定的功能和按钮来实现用户的请求。

苹果区分了“…

OpenAI 训练了一个基于 GPT-4 的模型 CriticGPT,用于帮助人类训练者在强化学习从人类反馈(RLHF)过程中发现 ChatGPT 输出代码中的错误,并提高了训练者捕捉这些错误的能力。

摘要

OpenAI 发布了一篇研究论文,介绍了他们基于 GPT-4 训练的一个新模型 CriticGPT,它能够帮助人类训练者识别 ChatGPT 生成代码中的错误。

实验结果表明,使用 CriticGPT 辅助的训练者在评估 ChatGPT 代码时,比没有辅助的训练者表现得更好,能够发现更多问题。

CriticGPT 通过 RLHF 方法进行训练,但与 ChatGPT 不同,它在…

Jina Reranker v2 专为Agentic RAG(Retrieval-Augmented Generation)系统设计,支持多语言检索、功能调用、代码搜索和超快的文档处理速度。

Jina Reranker v2 是 Jina AI 推出的最新一代reranker模型,它支持超过100种语言的多语言检索,能够进行功能调用和代码搜索,同时提供了6倍于前一代的速度提升。

该模型使用了 Flash Attention 2 技术,优化了注意力机制,使得模型在保持精度的同时大幅提升了文档处理速度。

Jina Reranker v2 的训练过程包括四个阶段:首先使用英文数据进行…

Anthropic 发布了 Claude 3.5 Sonnet,这是 Claude 3.5 系列模型的首个版本,它在智能、速度和成本效率方面都取得了显著提升,并且在多个评估中超越了同行模型和 Claude 3 Opus。

Claude 3.5 Sonnet 是 Anthropic 推出的新型号,它在渐进式评估中显示出超越前代模型和竞争对手的能力。该模型现在可以在 Claude.ai 和 iOS 应用上免费使用,对于订阅了 Claude Pro 和 Team 计划的用户,提供了更高的使用限额。此外,Claude 3.5 Sonnet 也可以通过 Anthropic API、A…

苹果公司推出了全新的人工智能系统——Apple Intelligence,该系统集成于iPhone、iPad和Mac,通过生成模型与个人上下文相结合,提供高度个性化和隐私保护的智能辅助功能。

苹果公司在2024年6月10日宣布推出Apple Intelligence,这是一款集成在iOS 18、iPadOS 18和macOS Sequoia操作系统中的个人智能系统。该系统利用苹果自研芯片的计算能力,结合生成模型,能够理解和创建语言和图像,跨应用程序执行任务,并根据用户的个人上下文简化日常操作。Apple Intelligence强调隐私保护,通过在设备上处理大部分数据和引入Priva…

OpenAI 推出了专为教育机构设计的经济型 AI 解决方案 ChatGPT Edu,旨在帮助大学校园范围内的学生、教职员工、研究人员和行政运营负责人负责任地使用人工智能。

OpenAI 宣布推出 ChatGPT Edu,这是一种针对大学的经济型 AI 产品,旨在负责任地将 AI 引入校园。该产品由 GPT-4o 驱动,支持文本和视觉理解,并具备数据分析等高级功能。ChatGPT Edu 提供企业级安全性和控制权限,并且价格适中,适合教育机构。OpenAI 观察到包括牛津大学、宾夕法尼亚大学沃顿商学院、德克萨斯大学奥斯汀分校、亚利桑那州立大学和哥伦比亚大学在内的一些大学在使用 Ch…

Mistral AI 发布了 Codestral,这是一款开源的代码生成 AI 模型,能够支持 80 多种编程语言,并通过 API 提供代码交互和完成功能,旨在提高开发者的效率和代码质量。

Mistral AI 宣布推出了其首款代码模型 Codestral,这是一款开源的、针对代码生成任务设计的生成 AI 模型。Codestral 支持超过 80 种编程语言,包括 Python、Java、C、C++、JavaScript 和 Bash 等流行语言,以及 Swift 和 Fortran 等特定语言。该模型旨在帮助开发者通过共享指令和完成 API 端点更高效地编写和交互代码,提升他们的…