《中醫藥大模型評測標準》發布
近日,中醫藥交叉學科和智能科學大會在中國中醫科學院舉辦,大會主題為“AI創新中醫發展、數智均衡醫療資源”。國家中醫藥管理局副局長、中國中醫科學院院長、中國工程院院士黃璐琦表示,中醫藥傳承數千年,積累了海量的中醫診療醫案、處方等數據,但由于中醫藥名詞術語與一般文本差別較大,挖掘其隱藏的知識、規律和經驗存在極大困難,阻礙了中醫藥的傳承創新。中醫藥與人工智能融合創新,既是歷史必然與時代剛需,更是守正創新的必由之路。“中醫藥大模型將傳統中醫與現代科技相結合,可為臨床、科研提供便利,但在大模型研發應用中,也存在模型訓練測評體系不健全、應用場景適用范圍不可知、模型臨床應用效果評估難、模型運行穩定性難保障等問題,亟需建立大模型評測技術與應用標準。”中國中醫科學院中醫基礎理論研究所副所長趙宇平說。大會發布了《中醫藥大模型評測標準》,該標準主要覆蓋場景豐富度、能力支持度、應用成熟度三大能力域,關注中醫藥大模型應用場景的覆蓋廣度、中醫藥大模型的全流......閱讀全文
《中醫藥大模型評測標準》發布
近日,中醫藥交叉學科和智能科學大會在中國中醫科學院舉辦,大會主題為“AI創新中醫發展、數智均衡醫療資源”。國家中醫藥管理局副局長、中國中醫科學院院長、中國工程院院士黃璐琦表示,中醫藥傳承數千年,積累了海量的中醫診療醫案、處方等數據,但由于中醫藥名詞術語與一般文本差別較大,挖掘其隱藏的知識、規律和經驗
國內首批大模型標準評測結果公布,4家通過
原文地址:http://news.sciencenet.cn/htmlnews/2023/12/514789.shtm12月22日,在全國信息技術標準化技術委員會人工智能分委會全體會議上,國內首個官方“大模型標準符合性評測”結果公布。結果顯示,首批有四家公司的大模型產品通過該評測,分別為百度文心一言
商湯大模型多個評測表現超ChatGPT
本報訊 (記者沈湫莎)商湯科技近日公布了自研中文語言大模型“商量SenseChat 2.0”在MMLU、AGIEval、C-Eval三個權威大語言模型評測基準的成績。評測顯示,“商量”在這三個測試集中的表現均領先ChatGPT,實現了我國語言大模型研究的突破。??????全球三大權威語言模型測評基準
商湯大模型“商量”多個評測表現超ChatGPT
原文地址:http://news.sciencenet.cn/htmlnews/2023/6/503362.shtm
上海發布“書生·浦語”大模型:評測表現優秀
“書生·浦語”聯合團隊選取了20余項評測對其進行檢驗,其中包含全球最具影響力的四個綜合性考試評測集,對“書生·浦語”、清華大學的GLM-130B、Meta的LLaMA-65B、OpenAI的ChatGPT和GPT-4進行了全面測試。6月7日,上海人工智能實驗室(上海AI實驗室)、商湯科技聯合香港中文
誰是最會做題大模型?“高考評測”來了
2024年全國高考的“硝煙”剛剛散去不久,“大模型考生”就被抓回來重新“做題”了。市面上涌現出的大模型產品讓人眼花繚亂,圍繞“大模型技術哪家強”的討論不絕于耳,各色名目的大模型評測應運而生。作為國內最權威的考試之一,高考覆蓋各類學科及題型,同時在開考前屬于“絕密”,非常適合用來作為考查大模型智能水平
評測成績比肩GPT4,商湯日日新大模型再升級
原文地址:http://news.sciencenet.cn/htmlnews/2024/2/517164.shtm近日,商湯科技發布“日日新SenseNova 4.0”,多維度升級了大模型體系。據介紹,日日新SenseNova 4.0 具備更廣泛的知識覆蓋、更穩定的推理能力、更優秀的長文本理解力、
IDC、智源最新一期大模型評測結果出爐
6月17日記者獲悉,由北京智源研究院(以下簡稱智源)打造的FlagEval天秤大模型評測平臺實現了全面升級,并公布202406期FlagEval模型評測排行榜單。最新一期榜單顯示,百度文心大模型、字節跳動“云雀”和“豆包”大模型的綜合評分在閉源對話模型中位列前三,GPT-4o、百川、零一萬物、k
IDC、智源最新一期大模型評測結果出爐
6月17日記者獲悉,由北京智源研究院(以下簡稱智源)打造的FlagEval天秤大模型評測平臺實現了全面升級,并公布202406期FlagEval模型評測排行榜單。最新一期榜單顯示,百度文心大模型、字節跳動“云雀”和“豆包”大模型的綜合評分在閉源對話模型中位列前三,GPT-4o、百川、零一萬物、kim
中醫藥人工智能大模型正式啟動
6月15日,在橫琴粵澳深度合作區舉行的中醫藥廣東省實驗室(以下簡稱橫琴實驗室)第一屆學術委員會第一次會議暨首屆橫琴中醫藥科技創新大會上,中醫藥橫琴大模型、中藥新藥智能自動化融合創新平臺同時啟動。這也是該實驗室揭牌半年來取得的新進展。2023年12月,橫琴實驗室正式揭牌成立,成為廣東省實驗室體系中的一
辛烷值的評測標準
不同化學結構的烴類,具有不同的抗爆震能力。異辛烷(2,2,4-三甲基戊烷)的抗爆性較好,辛烷值給定為100。正庚烷的抗爆性差,給定為0。汽油辛烷值的測定是以異辛烷和正庚烷為標準燃料,按標準條件,在實驗室標準單缸汽油機上用對比法進行的。調節標準燃料組成的比例,使標準燃料產生的爆震強度與試樣相同,此
訊飛星火在一項評測中獲評“最聰明”國產大模型
原文地址:http://news.sciencenet.cn/htmlnews/2023/8/506755.shtm
第一!醫渡科技大模型登頂上海AI實驗室權威評測榜
5月9日,面向中文醫療大語言模型的開放評測平臺MedBench更新評測榜單,醫渡科技大模型(評測名:HH-YIDU-Med)以綜合得分61.3分的出色成績登頂榜首,成為榜單中首個綜合評分超過60的醫療大模型。MedBench評測榜單節選 MedBench是由上海AI實驗室和上海市數字醫學創新中
AI賦能未來藥學,數智岐黃中醫藥大模型發布
原文地址:http://news.sciencenet.cn/htmlnews/2024/1/516371.shtm1月19日,由華東師范大學主辦的“AI賦能下的未來藥學產學研發展論壇暨華東師范大學藥學學科發展大會”在滬召開。會上發布了“數智岐黃”中醫藥大模型,該大模型由華東師范大學、上海中醫藥大學
構建生長育肥豬常用能量飼料營養價值評測模型
原文地址:http://news.sciencenet.cn/htmlnews/2023/2/494455.shtm記者2月23日從中國科學院亞熱帶農業生態研究所獲悉,由中國工程院院士、該所首席研究員印遇龍科研團隊黃瑞林研究員主持的“生長育肥豬常用能量飼料原料營養價值評定與預測方程建立”項目,已先后
全面走向“人工智能+”-國內首個汽車大模型標準發布
中國信息通信研究院(簡稱“中國信通院”)今天(28日)發布了國內首個汽車大模型標準。 標準主要涵蓋三個能力域,其中場景豐富度側重評估汽車大模型對智能座艙和自動駕駛等細分場景的支持情況,能力支持度重點關注汽車大模型在感知、理解、推理、生成等人工智能技術能力上的表現,應用成熟度主要評估汽車大模型在
面對大模型應用門檻高-如何大模型發揮更大價值?
原文地址:http://news.sciencenet.cn/htmlnews/2022/9/485510.shtm 人工智能預訓練大模型的研發,面臨著數據規模大、數據質量參差不齊、模型體積大、訓練難度高、算力需求大等一系列挑戰。在這樣的背景下,如何加速大模型的產業落地,讓大模型發揮更大價值?
μ介子實驗大搬家-有望顛覆粒子物理學標準模型
研究人員為儲存環制定旅行路線。 要去一個新地點,GPS導航儀會告訴你應該怎樣走。如果你詢問它如何從美國紐約厄普頓到芝加哥西郊,它會告訴你沿著80號州際公路一直向西行駛14個小時即可,而不是花費6周時間乘駁船沿東海岸向南航行,繞過佛羅里達州,穿過墨西哥灣,沿密西西比河溯流而上。 然而當
搶抓大模型行業機會
機器人在7月6日舉行的2023世界人工智能大會展會現場進行投籃表演。大會展示包括大模型、芯片、機器人、智能駕駛等領域的科技成果。 新華社記者 方 喆攝 今年以來,自ChatGPT發布后,多家企業先后發布了自己的大模型產品,業內稱之為“百模大戰”。與此同時,產業界對大模型的關注點也在發生變化,從
AI大模型“拿捏”電池壽命
作為現代生活中不可或缺的能源載體,電池的重要性不言而喻。從清晨喚醒我們的鬧鐘,到隨身攜帶的手機、平板電腦等智能設備,無一不依賴于電池提供的穩定電力。此外,隨著科技的發展,電動汽車、無人機等新興領域也廣泛應用了各類高性能電池,推動了綠色出行和智能科技的進步。因此,電池不僅極大地便利了我們的日常生活,還
權威AI基準評測發榜
6月30日,全球權威AI基準評測MLPerf最新V2.0訓練評測成績榜單公布。浪潮AI服務器表現優異,繼兩月前在MLPerf V2.0數據中心推理評測中斬獲全部冠軍后,本次又在MLPerf V2.0單機訓練性能繼續保持領先。 據了解,本次MLPerf 評測吸引了包括谷歌、NVIDIA、浪潮信息
109項中醫藥團體標準發布
26日,中華中醫藥學會聯合中國中藥協會、中國針灸學會、中國民族醫藥學會和中國藥膳研究會在京發布109項中醫藥團體標準。對規范中醫藥臨床診療、基本術語及評價方法等意義重大。 中華中醫藥學會發布《中醫臨床診療指南編制通則》等32項標準,明確中醫臨床診療指南制定的程序、方法、結構,同時在借鑒國際通用
百度文心大模型3.5已內測應用,實測得分超ChatGPT
原文地址:http://news.sciencenet.cn/htmlnews/2023/6/503251.shtm 6月20日消息,據內部人士透露,百度文心大模型3.5版本已內測可用。早在5月末中關村論壇上,百度創始人、董事長兼CEO李彥宏透露,百度大模型產品“文心一言”的“母本”將迎來3.5
實測得分超ChatGPT!百度文心大模型3.5版內測應用
原文地址:http://news.sciencenet.cn/htmlnews/2023/6/503256.shtm 6月20日消息,據內部人士透露,百度文心大模型3.5版本已內測可用。早在5月末中關村論壇上,百度創始人、董事長兼CEO李彥宏透露,百度大模型產品“文心一言”的“母本”將迎來3.5
什么是標準大氣模型
關于大氣分布模型張捍衛李彬華楊磊鐵瓊仙冒蔚中國科學院國家天文臺云南天文臺云南昆明’昆明理工大學云南昆明’摘要簡述了大氣垂直分布情況和高空探測方法分析了目前只能采用球對稱大氣分布模型的原因論證了隨觀測站、隨方位而異的天文大氣折射實測模型和折射延遲改正模型已經包含了觀測站上空大氣實際分布的非球對稱特性不
廈大嘗試AI大模型破譯甲骨文
近日,廈門大學信息學院自然語言處理實驗室教授史曉東團隊申報的“基于甲骨文多模態大模型的多元信息甲骨文輔助考釋模型”入選“探元計劃2024”“創新探索型項目”TOP10榜單。基于甲骨文多模態大模型的多元信息甲骨文輔助考釋模型。廈門大學供圖甲骨文也被稱作“殷墟文字”,距今已有三千多年歷史,是世界四大古文
GS-Junior、MiSeq和PGM-三大主流基因組測序儀對比評測
新一代基因組測序技術(Next-Generation Sequencing Technology)可謂掀開了生命科學新的篇章,不僅促進了許多研究方向的復蘇或蓬勃發展,也為大眾化基因組測序帶來了希望,但是對于不熟悉測序技術的科研人員來說,要從這個競爭激烈的行業過熱宣傳中找到自己想要的測序儀,并
AI參加高考,為何偏科嚴重
大模型參加高考,能考多少分?近日,科技創新交流平臺極客公園發布高考新課標Ⅰ卷大模型評測報告,在參試大模型中,GPT-4o以562分的成績排名文科第一。參加評測的8款國產大模型中,字節跳動旗下的豆包成績是542.5分,其后依次是百度文心一言4.0的537.5分和百川智能“百小應”的521分。本次大模型
釋放AI大模型促消費潛力
??今年的《政府工作報告》提出持續推進“人工智能+”行動,旨在抓住人工智能技術突破機遇,使我國數字技術與制造優勢、市場規模優勢充分結合,推動人工智能大模型廣泛應用,真正賦能千行百業、走進千家萬戶。在構建新發展格局戰略背景下,AI大模型在激活內需市場、促進消費升級等方面充滿“模”力。??隨著人工智能技
“大模型不是萬能的”
“大模型不是萬能的,不能過度神話它。”這句話,《中國科學報》記者今年在不同場合聽到多次。最近一次,是在“CCF太原大模型賦能文物古建保護與傳承論壇”上。自2022年底OpenAI推出大語言模型產品ChatGPT以來,世界仿佛一下子“覺醒”到大模型時代——不僅各“大廠”都在奮力發展大模型,喊出了“所有