- 2023/3/17 15:32:33
- cdQ原?/li>
- 来源Q?span>电脑?/span>
- 报纸~辑Q?a id="editor" href="/EditorArticle/5/" style="text-decoration: underline; color: blue;">吴新
- 作者:
逐步开放调?/span>预约
3?6日下午,癑ֺ于北京总部召开新闻发布会,主题围绕C代大语言模型、生成式AI产品文心一a。百度创始h、董事长兼首席执行官李R宏出席及癑ֺ首席技术官王v峰出席,q展CZ文心一a在文学创作、商业文案创作、数理推、中文理解、多模态生成五个用场景中的综合能力?/span>
从现场展C来看,文心一a某种E度上具有了对hcL囄理解能力Q回{的准确性、逻辑性、流畅性都逐渐接近人类水^。但李R宏也多次提及Q这cd语言模型q远未到发展完善的阶D,q步I间很大Q未来这D|间它一定会飞速发展,日新月异?/span>
癑ֺ同时公布了文心一a的邀h试方案?span style="margin: 0px; padding: 0px; outline: 0px; max-width: 100%; box-sizing: border-box !important; word-wrap: break-word !important;">3?6日vQ首批用户即可通过邀h试码Q在文心一a官网体验产品Q后l将陆箋开攄更多用户。此外,癑ֺ云即面向企业客户开放文心一aAPI接口调用服务??6日v正式开NU,搜烦“百度智能云”进入官|,可申请加入文心一a云服务测试?/span>
目前Q大语言模型和生成式AI代表了一个新技术范式,是全球每家企业都不可错过的机会。百度文心一a定位于h工智能基座型的赋能^収ͼ助力金融、能源、媒体、政务等千行百业的智能化变革。李彦宏表示Q“百度希望和大家一P推动人工技术进步,让所有h都能使用最先进的生产力工具Q让所有h都能从中受益。?/span>
“文心一a?l写三体
新闻发布会现场,李R宏展CZ文心一a在五个用场景的表现Q包括文学创作、商业文案创作、数理推、中文理解和多模态生成?/span>
在文学创作场景中Q文心一aҎ对话问题知名科qd说《三体》的核心内容q行了ȝQƈ提出了五个箋写《三体》的角度Q体现出对话问答、ȝ分析、内容创作生成的l合能力?/span>
此外Q文心一a准确回答了《三体》作者、电视剧角色扮演者等事实性问题。生成式AI在回{事实性问题时常常“胡~ؕ造”,而文心一a延箋了百度知识增强的大模型理念,大幅度提升了事实性问题的准确率?/span>
面对“于和伟和张鲁一有哪些共同点”、“于和伟和张鲁一谁更高”这c问题,文心一a也基于推理能力得Z正确{案?/span>
在商业文案创作场景中Q文心一a利完成了给公司起名、写Slogan、写新闻E的创作d?/span>
q箋三次内容创作生成中,文心一a既能准确理解人类意图Q又能清晰地表达Q这是基于庞大数据规模而发生的“智能涌现”。文心一a大模型的训练数据包括万亿U网|据、数十亿的搜索数据和囄数据、百亿的语x均调用数据,以及5500亿事实的知识图谱{,q让癑ֺ在中文语a的处理上Q能够处于独一无二的位|?/span>
文心一aq具备了一定的思维能力Q能够学会数学推演及逻辑推理{相对复杂Q务。面对“鸡兔同W”这c锻ghc逻辑思维的经兔RQ文心一a能理解题意,q有正确的解题思\Q进而像学生做题一P按正的步骤Q一步步出正确{案?/span>
文学创作、商业文案创作、数理推是大语a模型常见的优势和能力Q在此基上,文心一aq表现出更优U的中文理解及多模态生成能力?/span>
作ؓ扎根于中国市场的大语a模型Q文心一a具备中文领域最先进的自然语a处理能力Q在中文语言和中国文化上有更好的表现。在现场展示中,文心一a正确解释了成语“洛阳纸贵”的含义、“洛阳纸贵”对应的l济学理论,q用“洛阳纸贵”四个字创作了一首藏头诗?/span>
多模态生成方面,李R宏现场展CZ文心一a生成文本、图片、音频和视频的能力。有的是,文心一a甚至能够生成四川话等方言语音Q文心一a的视频生成能力则因成本较高,现阶D还未对所有用户开放,未来会逐步接入?/span>
“多模态是生成式AI一个明的发展势。”李彦宏表示Q“未来,随着癑ֺ多模态统一大模型的能力增强Q文心一a的多模态生成能力也会不断提升。?/span>
从文心一a的表现看Q某U程度上它具有了对hcL囄理解能力Q回{的准确性、逻辑性、流畅性都逐渐接近人类水^。但整体而言Q这cd语言模型q远未到发展完善的阶D,有赖于通过真实的用户反馈而逐步q代?/span>
王v峰表C,文心一aQ是C代知识增强大语言模型Q是在ERNIE及PLATOpd模型的基上研发的。它的关键技术包括有监督_调、hcd馈的强化学习、提C、知识增强、检索增强和对话增强。前三项是这cd语言模型都会采用的技术,ERNIE和PLATO中也已经有应用和U篏Q在文心一a中又有了q一步强化和打磨Q后三项则是癑ֺ已有技术优势的再创斎ͼ也是文心一a未来来强大的基础?/span>
李R宏强调:“文心一a徏立v真实用户反馈、开发者调用和模型q代之间的飞轮,效果会迅速提升,l你‘士别三日,当刮目相看’的惊喜。?/span>
大语a模型无法H击速成
目前Q百度是全球大厂中第一个做出对标ChatGPT产品的企业?/span>李R宏指出:“无论是哪家公司Q都不可能靠H击几个月就能做L大语a模型?/span>深度学习、自然语a处理Q需要多q的坚持和积累,没法速成?/span>?/span>
可以_文心一a是百度过dq努力的延箋。hc进入h工智能时代,IT技术的技术栈发生了根本性变化,从过M层到“芯?框架-模型-应用”四层。今天,癑ֺ是全球ؓC多、在q四层进行全栈布局的h工智能公司,从高端芯片昆仑芯Q到飞桨深度学习框架Q再到文心预训练大模型,到搜索、智能云、自动驾驶、小度等应用Q各个层面都有领先业界的自研技术?/span>
李R宏认为,癑ֺAI全栈布局的优势在于,可以在技术栈的四层架构中实现端到端优化,大幅提升效率。尤其是框架层和模型层之_有很强的协同作用Q可以帮助构建更高效的模型,q显著降低成本。事实上Q超大规模模型的训练和推理,l深度学习框架带来了很大考验。比如,Z支持千亿参数模型的高效分布式训练Q百度飞桨专门研发了 4D 混合q行技术?/span>
在全球范围内Q在四层架构的每一层都有领先品的公司几乎没有Q这是百度非常独特的优势。后l,芯片、框架、大模型和终端应用场景可以Ş成高效的反馈闭环Q帮助大模型不断调优q代Q从而升U用户体验?/span>
?月䆾癑ֺ官宣“文心一a”以来,已有过650家企业宣布接入文心一a生态。这意味着很多企业已经理解刎ͼ文心一a和生成式AI代表了一个新的技术范式,它会影响到每一家公司?/span>
AI市场爆发性的需求增长,释攑և前所未有的、指数的商业h倹{李彦宏预测Q大语言模型带来三大业机会?/span>
W一cL新型云计公司,其主商业模式从IaaS变ؓMaaS。文心一a根本性地改变云计行业的游戏规则。之前企业选择云厂商更多看力、存储等基础云服务。未来,更多会看框架好不好、模型好不好Q以及模型、框架、芯片、应用这四层之间的协同?/span>
文心一a通过癑ֺ云对外提供服务,帮助企业构徏自己的模型和应用Q农业、工业、金融、教肌Ӏ医疗、交通、能源等重点领域Q都会因此效率大q提升,q在每一个行业快速Ş成新的业空_助力数字中国的实现。李彦宏预告Uͼ癑ֺ云将于近期D办新d布会Q主题围l文心一a的云服务和应用品,既有公有云服务和也可以做U有化部|Ӏ?/span>
W二cLq行行业模型_调的公司,q是通用大模型和企业之间的中间层Q他们可以基于对行业的洞察,调用通用大模型能力,业客h供解x案。这斚wQ百度文心大模型已经在电力、金融、媒体等领域Q发布了10多个行业大模型?/span>
W三cLZ大模型底座进行应用开发的公司Q即应用服务提供商。李彦宏断言Q对于大部分创业者和企业来说Q真正的Zq不是从头开始做ChatGPT和文心一aq样的基大模型,q很不现实,也不l济。基于通用大语a模型抢先开发重要的应用服务Q这可能才是真正的机会。目前,Z文本生成、图像生成、音频生成、视频生成、数字h?D{场景,已经涌现出很多创业明星公司,可能是未来的新巨头?/span>
“我们相信,人工会彻底改变我们今天的每一个行业。AI的长期h|对各行各业的颠覆性改变,才刚刚开始。未来,会有更多的杀手应用、现象产品出现Q将会有更多的里E碑事g发生。?/span>李R宏说道?/span>
AI领域的竞赛已l开?/span>
?/span>一天,OpenAI发布多模态大型语a模型GPT-4.它的回答准确性更高,解决问题的能力更强,可以处理?.5万字的文本,q支持图像和文本输入Q输出文本Ş式?/span>
OpenAI发布了多模态预训练大模型GPT-4Q性能更加q支持多模态输入,OpenAI也随之发布技术报告ƈ开源AI模型性能评估框架OpenAI EvalsQl推动模型进步。目前,GPT-4已可在ChatGPT Plus和API调用中用。综合来看,GPT-4是大模型q军多模态的重要H破Q有望打开应用天花ѝ本ơGPT-4发布是“文-?视频”多模态趋势的向前一步,短期有望催化AI发展生态,长期x应用端更多可能性?/span>
一l推出,GPT-4卛_为其“看张草图,p一U生成网站”的表现成ؓ舆论焦点QƈM微博热搜。在专业和学术方面,GPT-4已经表现g人类的水q뀂例如,它在模拟律师考试中的得分能够排进?0%Q相比之下,GPT-3.5的得分只能排在倒数10%左右?/span>
GPT-4Z有如此优U的表玎ͼq还要从其底层技术说赗GPT(Generative Pre-trained Transformer )是辅助写作技术,通过机器学习、语a译来收集大量数据,最l输出新的内宏VGPT-4是OpenAIW四个“生成式预训l{换器”,依据2017q开发的H破性神l网l技术“{换器”,q极大提升了AI分析语音、图像的能力。媒体报道,GPT-4?00万亿的机器学习参敎ͼ比此前强?00倍,但是官方q未证实该说法?/span>
然而,l心的科技q已l发玎ͼ本次OpenAI对GPT-4模型背后的技术细节,已经三缄其口了。这或许意味着Q这家公司已l定位ؓ盈利性的U技企业?/span>
产品层面Q新模型提供给付费用户ChatGPT PlusQ也会集合到API供给使用者,允许开发者集成至产品。微软Bing的聊天机器h也已l用GPT-4模型Q用户可以免费尝鲜?/span>
而在OpenAI大Dq军商业化的同时Q百度董事长兼首席执行官李R宏曾在一场内部直播中表示QAIGCQAI生成内容Q和ChatGPTq些都是AI技术发展到一定地步后产生的新Z。“这个事情很难,但百度必要做。?/span>
今年1月Create AI开发者大会前夕,癑ֺ搜烦宣布基于百度自研的生成式模型,升“生成式搜烦”能力,q指出,生成式AI和搜索引擎是互补关系而不是替代,搜烦底层技术和AI底层技术是盔R的?/span>
文心一a是搜索引擎实现“模p搜索”到“精准推送”跨的关键Q生成式AI问世之前Q搜索引擎以“模p搜索”ؓ主,用户需要根据在搜烦引擎中打入关键字扑ֈ需要的内容或链接,而通过文心一aQ用户可以通过自然语言交互的方式轻松获得需要的内容或链接,且内容较为精准,即“精准推送”?/span>
与此同时Q生成式内容也会极大丰富内容生态和内容供给Q让成熟的搜索业务和搜烦体验焕发生机。这在于Q决定一个内容品^C质与否最关键的因素是内容数量、内容质量、客户互动?/span>
癑ֺ斚w认ؓQ相比ChatGPTQ文心一a能基于检索增强提升时效性准?Q搜索在真实数据和用户需求理解方面的U篏有较强的先发优势Q,q基于知识增强提升多轮推理对话(文心大模型定位知识增强大模型Q。此外,文心大模型是本土化的AI模型Q对中文、中国文化的理解更深Q更适合中文和中国市场?/span>
总而言之,一场全方位的AI竞赛已经展开Q更懂中国的人的文心一aQ会得到市场认可吗?
更多关于 电脑报官|?/a> 的文?/strong> |