掰开安卓手机满屏都是三个字:大模型

  新闻资讯     |      2023-11-24 21:04

  天博app先是图像生成大模型接二连三地被塞进手机,从十亿参数的Stable Diffusion,在手机上快速生成一只金毛小狗:

  国内有文心一言、智谱清言APP,国外则有OpenAI的移动版ChatGPT,Llama 2手机版也在加急准备中。

  苹果M3能运行“数十亿参数”机器学习模型,高通的骁龙X Elite和骁龙8 Gen 3更是已经分别实现将130亿和100亿参数大模型装进电脑和手机。

  就在最近,OpenAI还因为DevDay后“远超预期”的大模型调用流量,出现了全线产品宕机的史上最大事故。

  计算单元之外,有限的内存单元,是大模型进手机面临的第二道难关:大模型推理需要大量计算资源做支撑,与此同时,内存大小决定了数据处理速度的上限以及推理的稳定性。

  高通公布的数据显示,Hexagon NPU在性能表现上,比前代产品快98%,同时功耗降低了40%。

  具体而言,Hexagon NPU升级了全新的微架构。更快的矢量加速器时钟速度、更强的推理技术和对更多更快的Transformer网络的支持等等,全面提升了Hexgon NPU对生成式AI的响应能力,使得手机上的大模型“秒答”用户提问成为可能。

  Hexagon NPU之外,第三代骁龙8在Sensing Hub(传感器中枢)上也下了功夫:增加下一代微型NPU,AI性能提高3.5倍,内存增加30%。

  值得关注的是,官方提到,Sensing Hub有助于大模型在手机端的“定制化”。随时保持感知的Sensing Hub与大模型协同合作,可以让用户的位置、活动等个性化数据更好地为生成式AI所用。

  而在内存方面,第三代骁龙8支持LPDDR5X,频率从4.2GHz提高到了4.8GHz,带宽77GB/s,最大容量为24GB。

  并且,此番高通在内存和Hexagon NPU矢量单元之间增加了直连通道,进一步提高了AI处理效率。

  恰逢骁龙峰会期间,SK海力士还特别宣布,其产品LPDDR5T已经在高通第三代骁龙8上完成了性能及兼容性验证,速度达到9.6Gbps。由此看来,搭载第三代骁龙8的手机在内存方面还有更多的选择。

  除此之外,在CPU方面,第三代骁龙8采用“1+5+2”架构(1个主核心、5个性能核心和2个能效核心),相较于前代的“1+4+3”,将1个能效核心转换为性能核心。其中超大核频率提升到3.3GHz,性能核心频率提升到最高3.2GHz,能效核心频率提升到2.3GHz。

  调制解调器同样有5G AI处理器的加持:通过分析信号完整性和信噪比,AI能够改善无线带宽、延迟等性能指标。

  不过,虽说硬件技术能解决大模型移植到智能终端的关键难点,但要想让它真正落地应用,仍需要迈过另外一重门槛。

  从最早在手机上运行10亿参数Stable Diffusion,到快速基于骁龙8 Gen 3适配百亿参数大模型,背后实际上还离不开一类软件能力——

  像是这篇被NeurIPS 2023收录的论文,就针对当前大模型的“基石”Transformer架构进行了量化相关的研究。

  量化是压缩AI模型的一种经典方法,然而此前在压缩Transformer模型的时候,容易出现一些问题。

  这篇论文提出了两种方法来对Transformer模型进行量化,在确保压缩效果的同时,进一步提升模型输出性能,确保模型看起来“更小更好”。

  不同的计算平台之间,硬件的配置往往差异很大,电脑上能运行的大模型,放到手机上还真不一定就能立刻运行。

  这是一套容纳了大量AI技术的工具包,全面支持各种主流AI框架、不同操作系统和各类编程语言,能提升各种AI软件在智能终端上的兼容性。

  不仅如此,这套软件栈还包含高通AI Studio,相当于将高通的所有AI工具集成到一起,直接进行可视化开发。

  AI软件只需要在里面从设计、优化、部署到分析“走一趟流程”,就能快速转换成在其他操作系统和平台上也可以运行的软件产品。

  只需要一次开发,甚至是大模型软件的开发,就能让它在多个平台运行,不需要担心适配的问题,像Stable Diffusion就已经部署到其中,其他平台也同样可以随取随用了。

  一方面,对于硬件性能而言,芯片已经从单纯的硬件性能对比、算力较量、功耗计算,逐渐转变成对AI算力的比拼,甚至是对AI软硬件技术能力的全面要求。

  在微软前不久的一篇训练研究中,就系统阐述了大模型在FP8精度下训练的效果,能在同样硬件成本下,训练更大规模的大模型、同时确保训练出来的模型性能。

  显然,从不同科技巨头最新研究中能看出,在这个技术日新月异的时代,手握一张底牌就能抓住机遇、打出自身价值的概率,正变得越来越低。

  如果还停留在“硬件公司造好芯、软件公司做好算法”的阶段,势必只会被其他虎视眈眈的厂商超过,在「模力时代」失去已有的竞争力。

  高通在前阵子推出的中就提到,将大模型部署到个人智能终端上,不仅要考虑硬件,也同样需要考虑模型个性化、计算量等问题。

  但相比等待大模型厂商去解决这些问题,高通选择自己在软件方面进行研究,最新成果也同样实时写成论文分享出来。

  另一方面,对于算力更受限、用户范围更广的终端而言,未来的趋势必然是无缝互联。这就意味着,跨平台适用性会成为AI解决方案的关键。

  即使只有一个设备拥有键盘和鼠标,也能对各类设备进行无缝控制,甚至让AI软件也无障碍在各个设备之间连接使用。

  不仅手机和PC等不同的终端设备之间可以共享数据、更可能让同一套设备在不同的操作系统之间完成一系列流畅操作,像是手机和PC的音频在耳机之间无缝切换:

  之前只有在手机上能使用的AI应用,有了这套系统就能扩展到千万台智能终端设备上,包括PC、XR、平板和汽车。

  这样一来,大模型就不再会受限于某一台设备、或是某一个操作系统,而是能快速将已经在一类终端中实现的AI能力快速套用到更多设备中,最终实现“万物皆可大模型”的操作。

  总结来看,在大模型时代下,AI厂商不仅需要具备软硬件结合的能力,更需要提前布局智能终端万物互联的未来,以「连接」技术加速大模型在场景下的落地应用。

  全新航海商务智能腕表,专为水上活动爱好者设计搭载1.3英寸AMOLED屏幕,内置LED手电筒,长达16天电池续航【2023年11月16日】今日,专业运动智能可穿戴设备及创新航海设备品牌佳明(纽交所代码:GRMN)宣布推出quatix 7 Pro航海商务智能腕表。腕表全面搭载佳明领先的运动、

  11月13日下午,抖音发布《关于严厉打击非法传播领养、送养儿童信息的公告(第三期)》公告:2022年至今,抖音安全中心向各地警方提供的涉拐卖线起,配合警方抓获相关犯罪嫌疑人34人。这个数据背后,有一个专门的抖音打拐团队。除却45起立案的案件,他们实际的报案

  爱企查App显示,近日,北京三快科技有限公司申请注册“美团大象智体”商标,国际分类为网站服务,目前商标状态为等待实质审查。公开信息显示,此前,美团曾推出美团大象App,致力于提升企业员工线上办公效率和体验,支撑企业安全管控和组织管理,为业务提供基础通信服务

  商家朋友们请注意!2023抖音电商图文免佣经营全国统一考试来啦!前不久平台推出图文免佣学霸笔记,将大家经营过程中困惑较多、容易出错的知识点进行了盘点,并给出学霸级经营技巧引导。听说很多小伙伴已经利用学霸笔记提升了经营能力,当然,也有一部分朋友还在探索中。今

  探寻,不断汲取养分,成长,是恒久的议题。沉淀过往,焕新启程,自品牌成立以来,ANNWA安华卫浴一直不断创新突破,深刻洞察年轻人的生活方式和消费需求,以智能科技、时尚设计、人性化功能和优质服务,带给用户更年轻时尚的生验。2023年,ANNWA安华品牌再度蜕变焕新

  作为云计算的下一个迭代,Serverless 可以使开发者更专注于构建产品中的应用,而无需考虑底层堆栈问题。伴随着近年来相关技术成熟度的增加,市场对 Serverless 的接受程度也变得越来越高。可以说时至今日,Serverless 已迈入了向成熟稳定方向发展的高速轨道。作为一款火

  据今年第十四届亚洲营养大会的数据显示,我国成年居民超重肥胖率已超50%,高油高盐摄入在我国仍普遍存在!比起令快朵颐的煎烤油炸类美食,“蒸”这一烹饪方式能够保证食物中原有的蛋白质、纤维素等有益成分不被破坏,让我们可以品尝到食材的原汁原味。因此,口感鲜美

  箭牌家居秉持“人文卫浴”品牌理念,深耕家居行业多年,着力智慧卫浴产品的技术革新。一直以来,箭牌家居不断打破传统家居行业的发展框架,在智能、环保、健康三大方向持续加码,持续布局家居智能化技术研发,释放数字化转型强大势能,引领行业智造升级。今年11月初,箭

  导语:如今,随着将大模型塞进手机的进程加快,普通用户也能亲自体验生成式AI的魅力了。2023 已经行至尾声,这一年大模型和生成式 AI成为人工智能圈的主流趋势。自ChatGPT 出现以来,各式各样通用、专业的 AI 大模型层出不穷,喷涌之势已经不可阻挡。随着量化、网络剪枝

  11月13日,MBV INTL携手大人集团在深圳举办了香港联交所敲锣开市庆功晚宴,MBV INTL董事长拿督陈洺臣先生、执董拿督陈明光先生、执董陈明生先生、执董拿汀江修屏女士、执董侯艳丽女士、独董徐倩珩女士、大人集团发起人戴政先生、民航投资基金董事长高建明先生、民航投资

  (原标题:亚信科技、清华大学“算力内生网络技术”荣获中国自动化学会“2023科技进步一等奖”)近日,我国自动化科学领域权威组织——中国自动化学会(英文缩写:CCA)公布了2023年度“科技进步奖”评审结果,亚信科技、清华大学的“算力内生网络关键技术及应用”凭借在“

  近日,腾讯多媒体实验室全新发布《VR技术》,重点介绍了一套业界领先的VR视频传输解决方案。这一创新方案将为用户带来更高清、更沉浸的观看体验,也将进一步推动VR技术的普及和应用,为未来数字产业带来更多的创新和可能性。传统VR视频一直受制于网络传输和硬件设

  第六届中国国际进口博览会(以下简称“进博会”)于11月5日在国家会展中心(上海)盛大开幕,本届进博会为期6天,以“新时代共享未来”为主题,规模盛大,亮点众多:参展的世界500强和行业龙头企业数量均超历届,展览面积创新高,来自154个国家和地区的宾客,超过400项新产品、新技

  2023 OPPO开发者大会正式开幕,ColorOS 14亮相,手机流畅进入「最后一公里」比拼

  2023年11月16日,OPPO开发者大会正式开幕,万众期待的ColorOS 14正式发布,并且已经确定,将由OPPO Reno11系列首发。本次的ColorOS 14将OPPO之前布局的AndesGPT、潘塔纳尔自研系统、超算平台三大技术全面整合,带来全新智慧新体验。智慧互融,化繁为简;软硬芯协同,设备流畅度

  就算2023年已经进入倒计时,我们也仍在见证着AI大模型行业的瞬息万变。一个不断孕育大模型全新生机的生态土壤正在加速到来。别让技术的星火等候,一次掷地有声的官宣11月16日,2023OPPO开发者大会在上海世博中心举行,会上OPPO正式发布了自主训练的个性专属大模型与智能体—

  魔力十年打出OTT行业新格局:天猫魔盒推超级 TV 盒子,天猫魔屏双 11 “终身会员免费送” !

  本网站LOGO小熊标志受版权保护,版权登记号:鲁作登字-2015-F-025467,未经ITBEAR官方许可,严禁使用。