日本將開發更強日語能力的“大語言模型”人工智能技術
據共同社消息,日本東北大學和日本東京工業大學等團隊計劃開發一種更強日語能力的“大語言模型”,作為生成式人工智能(AI)的基礎技術。該團隊將利用理化學研究所的超級計算機“富岳”學習大量數據,并將在本年度內逐步公開。這一技術的開發將使國內企業和研究人員能夠為自己的公司的服務或研究而自行改良。生成式AI可以按照用戶的要求生成文章、圖像、音頻等。雖然美國創新企業“OpenAI”的“ChatGPT”和美國谷歌公司的“Bard”等也利用了“大語言模型”技術,但海外企業開發的生成式AI在日語數據學習方面存在限制。該團隊將檢查互聯網上的文章數據,提高日語占比并讓AI學習,制作獨有的“大語言模型”。此外,富士通和理研也已加入團隊,計劃開發其他語言和項目的代碼。......閱讀全文
人工智能新模型可解碼DNA隱藏“語言”
DNA包含了維持生命所需的基礎信息。理解這些信息是如何存儲和組織的,一直是20世紀最大的科學挑戰之一。現在,借助GROVER這一基于人類DNA訓練的新型大型語言模型,研究人員有望解碼基因組中隱藏的復雜信息。GROVER由德國德累斯頓工業大學生物技術中心開發,它將人類DNA視為文本,通過學習其規則和上
人工智能新模型可解碼DNA隱藏“語言”
DNA包含了維持生命所需的基礎信息。理解這些信息是如何存儲和組織的,一直是20世紀最大的科學挑戰之一。現在,借助GROVER這一基于人類DNA訓練的新型大型語言模型,研究人員有望解碼基因組中隱藏的復雜信息。GROVER由德國德累斯頓工業大學生物技術中心開發,它將人類DNA視為文本,通過學習其規則和上
人工智能新模型可解碼DNA隱藏“語言”
DNA包含了維持生命所需的基礎信息。理解這些信息是如何存儲和組織的,一直是20世紀最大的科學挑戰之一。現在,借助GROVER這一基于人類DNA訓練的新型大型語言模型,研究人員有望解碼基因組中隱藏的復雜信息。GROVER由德國德累斯頓工業大學生物技術中心開發,它將人類DNA視為文本,通過學習其規則
日本將開發更強日語能力的“大語言模型”人工智能技術
據共同社消息,日本東北大學和日本東京工業大學等團隊計劃開發一種更強日語能力的“大語言模型”,作為生成式人工智能(AI)的基礎技術。該團隊將利用理化學研究所的超級計算機“富岳”學習大量數據,并將在本年度內逐步公開。這一技術的開發將使國內企業和研究人員能夠為自己的公司的服務或研究而自行改良。生成式AI可
AI語言模型“提速”藥物發現
原文地址:http://news.sciencenet.cn/htmlnews/2023/6/502762.shtm美國麻省理工學院和塔夫茨大學研究人員設計出一種基于大型語言模型(如ChatGPT)的人工智能算法,這種稱為ConPLex的新模型可將目標蛋白與潛在的藥物分子相匹配,而無需執行計算分子結
日本發布大規模語言模型
科技日報訊?(記者李楊)東京工業大學、日本理化學研究所及富士通公司等近日宣布,利用超級計算機“富岳”,他們開發的大規模語言模型“Fugaku-LLM”正式發布。“Fugaku-LLM”是首個完全由日本國產技術構建的AI語言模型,其在處理日語及相關文化內容上表現卓越。模型特別擅長基于日語敬語進行自然對
日本發布大規模語言模型
東京工業大學、日本理化學研究所及富士通公司等近日宣布,利用超級計算機“富岳”,他們開發的大規模語言模型“Fugaku-LLM”正式發布。 “Fugaku-LLM”是首個完全由日本國產技術構建的AI語言模型,其在處理日語及相關文化內容上表現卓越。模型特別擅長基于日語敬語進行自然對話,并展現出在人
首個種業大語言模型“豐登”發布
4月28日,中國農業大學生物學院教授王喜慶團隊聯合上海人工智能實驗室、崖州灣國家實驗室發布首個種業大語言模型“豐登”(SeedLLM)。種業大語言模型“豐登”。中國農業大學供圖“豐登”集成了先進的人工智能技術(書生·浦語2.0)與大數據分析,通過深入學習我國迄今發布的科研文獻、科技書籍、種企報告和歷
ChatGPT進入課堂:語言模型如何改變教育
最近,教育心理學家羅納德·貝格托(Ronald Beghetto)以一種引人注目的方式引領一群研究生和教育專業人員,與一系列以創造力為中心的聊天機器人進行了交流。這些聊天機器人由貝格托設計,即將托管在亞利桑那州立大學(ASU)設立的平臺上。這些機器人使用與ChatGPT相同的人工智能(AI)技術,目
神經機器模型能翻譯200種語言
自然》5日發表的一篇論文報道了一個Meta人工智能(AI)模型的底層技術。該模型能翻譯200種不同語言,增加了機器翻譯的語言數量。神經機器翻譯模型利用人工神經網絡翻譯各種語言。這些模型通常需要大量可在線獲取的數據加以訓練,但并非所有語言數據都是公開、低成本或是普遍可及的,這類語言被稱為低資源語言。一
神經機器模型能翻譯200種語言
科技日報北京6月5日電?(記者張夢然)《自然》5日發表的一篇論文報道了一個Meta人工智能(AI)模型的底層技術。該模型能翻譯200種不同語言,增加了機器翻譯的語言數量。神經機器翻譯模型利用人工神經網絡翻譯各種語言。這些模型通常需要大量可在線獲取的數據加以訓練,但并非所有語言數據都是公開、低成本或是
8個小技巧“用好”大語言模型
用大語言模型,還需要技巧?在人們的印象中,這是個極其簡單的操作:只需輸入一個問題,立刻就能得到回答。但實際上,如何有效地與這些人工智能模型互動,發揮出它們的最大潛力,卻是一個經常被忽視的話題。中國科學技術大學心理學系特任研究員林志成關注到這一話題,并在他最近的評論文章中提供了一系列的策略和指導,希望
新引擎實現大語言模型推理速度顯著提升
原文地址:http://news.sciencenet.cn/htmlnews/2023/11/511841.shtm
我國學者提出用好大語言模型實用策略
當前,大語言模型的應用日益廣泛,覆蓋從文本生成到復雜問題解決等多個領域,如何更好利用AI工具?記者10日從中國科學技術大學獲悉,該校心理學系林志成特任研究員近日在其評論文章中研究提出一項實用策略,幫助更好理解和利用先進的人工智能工具,有效發揮人工智能模型交互的最大潛力。在《自然人類行為》(Natur
我國學者提出用好大語言模型實用策略
中新網合肥5月10日電 (記者 吳蘭)當前,大語言模型的應用日益廣泛,覆蓋從文本生成到復雜問題解決等多個領域,如何更好利用AI工具?記者10日從中國科學技術大學獲悉,該校心理學系林志成特任研究員近日在其評論文章中研究提出一項實用策略,幫助更好理解和利用先進的人工智能工具,有效發揮人工智能模型交互的最
文斐:研究解決大型語言模型的存儲瓶頸問題
原文地址:http://news.sciencenet.cn/htmlnews/2023/4/497858.shtm“由于半導體器件的物理限制,摩爾定律已經難以為繼;今后計算機芯片的效率提升將主要來源于體系架構的創新。”華南理工大學計算機科學與工程學院原院長、廣東省計算機學會理事長韓國強對《中國科學
人工智能讓失語者重拾兩種語言
大腦植入物首次幫助一個無法清楚表達的雙語者用兩種語言進行交流。與大腦植入物相連的人工智能系統能夠實時解碼他試圖用西班牙語或英語說的話。5月20日發表于《自然-生物醫學工程》的這項研究成果,為人們了解大腦如何處理語言提供了見解,并有朝一日研發出能夠讓無法口頭交流的人恢復多語種語言的長效設備。醫學影像顯
C++排序庫首次更改:人工智能改進編程語言
英國深度思維公司的人工智能體“阿爾法開發”(AlphaDev),已被證明能發現并改進C++(一種常用的計算機編程語言)庫里廣泛使用的計算機排序算法。《自然》7日刊登的這些人工智能(AI)生成的算法已被整合到C++排序庫,這也是10多年來對這部分庫作出的首次更改。?? ?? ?研究團隊使用“Alpha
MOFormer:無需3D結構、基于Transformer的預測語言模型
金屬有機框架(MOF)是具有高比表面積、高孔隙率和結構可設計的結晶性多孔材料,可用于氣體吸附、氣體儲存、氣體分離、催化劑等領域。 然而,MOF 的化學空間非常巨大。發現適合特定應用的最佳 MOF 需要對無數潛在候選材料進行高效、準確的搜索。快速且低成本地為特定任務選擇性能最佳的 MOF 一直具有挑
東北大學研究團隊發布TechGPT2.0大語言模型
近日,計算機科學與工程學院任飛亮副教授主持的“東北大學知識圖譜研究組”發布了大語言模型TechGPT2.0。 TechGPT-2.0在繼承了TechGPT-1.0全部特性的同時,通過增加多領域、多任務的數據,展現出了嵌套實體的抽取、幻覺回答、回答不可回答問題和回答長文本問題的能力。這些改進使得
科研人員利用大語言模型解釋調節睡眠的分子機制
華中科技大學生命學院張珞穎團隊和薛宇團隊在Nature Communications雜志上合作發表了題為“Large-language models facilitate discovery of the molecular signatures regulating sleep and activ
科研人員利用大語言模型解釋調節睡眠的分子機制
華中科技大學生命學院張珞穎團隊和薛宇團隊在Nature Communications雜志上合作發表了題為“Large-language models facilitate discovery of the molecular signatures regulating sleep and activ
科學家評估大型語言模型回答醫學問題的能力
圖為研究團隊的方法和現有技術的比較。Flan-PaLM540B模型在MedQA,MedMCQA和PubMedQA數據集上均超過了以往最先進的SOTA,每列上方顯示的是準確率百分比。 你在網上搜過“我哪哪疼是不是得了啥啥病”嗎?答案可能不盡如人意。但隨著ChatGPT等大型自然語言模型(LLM)
東北大學研究團隊發布TechGPT2.0大語言模型
近日,計算機科學與工程學院任飛亮副教授主持的“東北大學知識圖譜研究組”發布了大語言模型TechGPT2.0。TechGPT-2.0在繼承了TechGPT-1.0全部特性的同時,通過增加多領域、多任務的數據,展現出了嵌套實體的抽取、幻覺回答、回答不可回答問題和回答長文本問題的能力。這些改進使得模型更適
施普林格·自然將提供人工智能語言潤色工具
國際知名學術出版機構施普林格·自然15日向媒體發布信息稱,繼使用人工智能(AI)生成圖書等應用之后,其投資并通過投資公司旗下“美國期刊專家”(American Journal Experts,AJE)開發出一款基于人工智能的語言潤色工具,最近又決定將該工具作為一項免費服務提供給自己的圖書作者和
中醫藥人工智能大模型正式啟動
6月15日,在橫琴粵澳深度合作區舉行的中醫藥廣東省實驗室(以下簡稱橫琴實驗室)第一屆學術委員會第一次會議暨首屆橫琴中醫藥科技創新大會上,中醫藥橫琴大模型、中藥新藥智能自動化融合創新平臺同時啟動。這也是該實驗室揭牌半年來取得的新進展。2023年12月,橫琴實驗室正式揭牌成立,成為廣東省實驗室體系中的一
崖州灣國家實驗室聯合發布首個種業大語言模型
人工智能技術能給“農業芯片”帶來怎樣的助力?國內首個種業大語言模型的推出,或許可以給出全新的探索路徑。據崖州灣國家實驗室最新發布消息,崖州灣國家實驗室精準設計與智造團隊聯合中國農業大學、上海人工智能實驗室共同發布首個種業大語言模型“豐登” ,英文名稱Large Language Model for
360智腦通過中國信通院可信AIGC大語言模型功能評估
原文地址:http://news.sciencenet.cn/htmlnews/2023/6/502739.shtm6月12日,360智腦的360GPT-S2-V8型號產品獲得了中國信息通信研究院(以下簡稱“中國信通院”)“可信AIGC大語言模型基礎能力”評估報告(以下簡稱“報告”),報告顯示必選項
微調大語言模型,科學家開發化學文本挖掘新方法
6月7日,中國科學院上海藥物研究所研究員鄭明月課題組在五項化學文本挖掘任務上對多個大語言模型的能力進行了全面綜合的探究,展現了微調大語言模型成為一種通用高效的生成式文本挖掘方法,為大模型的落地應用提供參考。相關研究發表于《化學科學》。?近兩年,以ChatGPT為代表的大語言模型(LLM)引領了人工智
模仿原聲:迄今最復雜人工智能語音模型創建
原文地址:http://news.sciencenet.cn/htmlnews/2023/6/503513.shtm Meta稱研制出迄今最復雜人工智能語音模型。圖片來源:英國《每日郵報》網站科技日報北京6月25日電?(記者劉霞)據英國《每日郵報》23日報道,臉書母公司元宇宙平臺公司(Met