科技资讯

德国连锁超市Aldi在其位于芝加哥郊区奥罗拉的一家门店推出了一项名为ALDIgo的尖端购物体验,这是与Grabango合作的成果。这种无结账、无收银员的购物方式允许顾客如常购物,但店铺内安装了先进的计算机视觉摄像头和天花板扫描器,能够精确记录顾客购物车内的所有商品。

在这家店铺,顾客无需排队结账、无需与收银员交流,也无需操作扫描器。顾客可以使用信用卡或借记卡支付,或者下载Grabango应用程序,通过二维码更快地完成支付。该应用程序支持多种支付方式,包括Apple Pay,未来可能会增加Google Pay选项。尽管如此,顾客仍需自己打包购买的商品。

Grabango的创始人兼首席执行官W…

英特尔公司最近宣布他们已经构建了世界上最大的神经拟态计算机,这台被称为“Hala Point”的计算机模仿了人类大脑的结构和功能,旨在支持未来的人工智能(AI)研究。与传统使用中央处理单元(CPU)和图形处理单元(GPU)的计算机系统相比,Hala Point在执行AI工作负载时速度可提升50倍,能源效率提高100倍。这一成果尚未经过同行评审,但已经发布在IEEE Explore预印本服务器上。

Hala Point将被部署在新墨西哥州的桑迪亚国家实验室,科学家们将利用它来解决设备物理、计算架构和计算机科学方面的问题。该系统由1152个英特尔公司新开发的Loihi 2处理器驱动,这是一种神经…

近日,谷歌推出了一种人工智能(AI)模型——“可扩展的集合包络扩散采样器”(SEEDS),并声称该模型能够生成大规模且准确的天气预报,并且成本比传统的基于物理的预测方法更低。

SEEDS模型的设计灵感来源于流行的大型语言模型(LLMs)和生成性AI工具,例如ChatGPT和Sora。这些工具能够通过文本提示生成视频。SEEDS能够快速且成本低廉地生成多个气象预测集合,这比传统的预测模型要高效。

在《科学进展》杂志3月29日发表的一篇论文中,研究团队描述了他们的发现。天气预测一直是一个挑战,因为有许多变量可能导致潜在的灾难性天气事件,如飓风和热浪。随着气候变化的加剧,极端天气事件变得更加频繁…

一项新研究利用大脑扫描和机器学习技术,确定了与精神病相关的两个关键大脑区域。这项研究可能证实了一个长期的假设,即精神病患者之所以会出现与现实的突然断裂,是因为控制注意力的大脑网络发生故障。这种故障导致患者经历幻觉(对并未实际发生的事件的感觉)和妄想(坚定不移的虚假信念)。精神病是精神分裂症等严重心理障碍的一个特征,但其症状也存在于一个连续体中,并且可能在没有任何明确定义的心理障碍的情况下出现。

多年来,科学家们一直难以确切了解大脑中导致精神病的具体机制。一个原因是,精神病通常在长期服用抗精神病药物的人群中进行研究,因此很难区分与状况相关或与药物相关的大脑变化。

为了从早期阶段找出精神病的潜…

在"CadenceLIVE硅谷2024"大会上,英伟达的首席执行官黄仁勋与主办方Cadence公司的首席执行官进行了深入对话。黄仁勋在会谈中提出,未来人形机器人将成为主导趋势。他预测,不久的将来,人形机器人的制造将成为常态,并且其成本可能会远低于人们的预期。黄仁勋举例说明,考虑到低廉的汽车售价大约在1至2万美元之间,他展望未来人们可以用相同的价格购买到一个人形机器人。

他进一步解释说,由于当前大多数环境都是为了适应人类而建造的,如生产线、仓库等,因此人形机器人在这些环境中可能更具灵活性和多功能性,同时还能提供更高的生产力。黄仁勋对将生物学与工程学结合的前景充满热情,并表示他特别喜欢这一点。他…

近期,基于音频的音乐生成模型取得了显著进展,但迄今为止还未能生成具有连贯音乐结构的完整长度音乐曲目。本研究表明,通过对长期时间上下文进行训练,可以生成最长达到4分钟45秒的长篇音乐。我们的模型由一个扩散变换器组成,该变换器在一个高度下采样的连续潜在表示上操作(潜在速率为21.5赫兹)。根据音频质量和提示对齐度的指标,它获得了最先进的生成效果,并且主观测试表明,它能够产生具有连贯结构的完整长度音乐。…

初创公司 Truss 的 CTO Ken Kantzer 分享了其公司使用大型语言模型(LLM)的经验,并总结出了七条宝贵经验:

Truss在过去六个月内发布了一些依赖于LLM的功能,在通过处理超过5亿个令牌后,我们发现LLM的现实应用与Hacker News上的讨论开始出现分歧。以下是我们从实际应用中得到的一些“令人惊讶”的教训。

首先,我们使用的是OpenAI模型,主要是GPT-4和GPT-3.5,并且只处理文本数据。作者提出了以下几点经验:

  1. 提示(prompts)的简洁性:作者发现,如果某些指令已经是常识,那么在提示中不过多列举具体列表或指令会产生更好的结果。这与编程中必须明…

Google 近期发布了一款名为ScreenAI的视觉-语言模型,它专门用于理解和交互用户界面(UI)和信息图表(如图表、图解和表格),并在基于UI和信息图表的任务上取得了行业领先的成果。该模型的发布伴随着三个新数据集的推出:Screen Annotation(用于评估模型布局理解能力)、ScreenQA Short(短问答)和Complex ScreenQA(复杂问答),这些数据集旨在更全面地评估模型的问答能力。

用户界面和信息图表在人际交流和人机交互中扮演着重要角色,它们通过丰富和互动的用户体验促进了信息的传递。UI和信息图表共享类似的设计原则和视觉语言(例如图标和布局),这提供了构建一…

在采访中,Meta的CEO扎克伯格与海外媒体人Dwarkesh Patel就AI技术、Llama模型、Meta AI、以及元宇宙等话题进行了深入的探讨。

首先,扎克伯格介绍了Meta新发布的Llama 3模型,该模型包含80亿参数、700亿参数和4050亿参数三个版本,这些模型将推动Meta AI的发展。Meta AI结合了Google和Bing的实时知识检索功能,并在辅助功能、VR中得到应用,将在未来几个月内推出更多新功能。扎克伯格特别强调了开源对于社区和创新的贡献,并讨论了AI能力的质变可能带来的开源风险。

扎克伯格还提到了Llama 4模型的可能性、在定制芯片上训练Llama模型的计…

过去几十年的自动化主要关注于提高效率,即机器帮助人类加快完成各种任务。当前十年,借助人工智能(AI)的推动,效率将实现飞跃性的进步,同时也会更加复杂。过去,软件仅仅是数字化和增强了人类的工作与服务,但在2.0版本的自动化中,机器人将成为“大脑”。

人工智能公司正在引领从“软件即服务(SaaS)”向“服务即软件”的转型,颠覆了SaaS的核心理念。在软件业务中,公司可能会出售对其平台或工具的访问权,但客户仍需使用这些工具来实现期望的结果。而在服务业务中,实现期望结果的责任则落在提供服务的公司身上。例如,不再提供QuickBooks软件,而是提供由AI会计师执行的税务服务。这一变化的积极面是巨大的…