界面新聞記者 | 肖芳
界面新聞編輯 | 文姝琪
繼上線高考志愿大模型之后,夸克AI搜索又接入了自研的健康大模型。
夸克健康大模型是以通義千問為基礎(chǔ)訓(xùn)練出來的垂類模型。夸克健康算法負責(zé)人徐健對界面新聞表示,在訓(xùn)練過程中,技術(shù)團隊不只是訓(xùn)練AI做簡單的醫(yī)學(xué)問答,而是希望AI學(xué)會整體的診療思維。
徐健表示,健康大模型背后的技術(shù)策略包括三個方面,第一是構(gòu)建優(yōu)質(zhì)的大規(guī)模數(shù)據(jù),這是模型知識性的底層;第二是正確性對齊及循證的技術(shù),可以系統(tǒng)解決好正確性方面的問題;第三是醫(yī)療慢思考推理能力的建設(shè),通過它解決復(fù)雜問題。
在垂類模型與通用模型對比中,夸克健康大模型呈現(xiàn)出在復(fù)雜問題中表現(xiàn)更好于通用模型的趨勢。其中,在主任醫(yī)師級別的性能測試中,夸克健康大模型回答的正確率為67.7%,DeepSeek-R1和GPT-o3-mini的正確率分別為38.7%和35.5%,而在初級醫(yī)師級別測試中,夸克健康大模型和DeepSeek-R1的正確率均超過80%,GPT-o3-mini的正確率也超過了70%。
徐健告訴界面新聞,夸克健康大模型在性能測試中能夠更好地回答復(fù)雜問題,并不是一口氣就做好的,而是經(jīng)歷了一個長期迭代。這個過程中,研發(fā)團隊主要在數(shù)據(jù)分類和評估、語料探查技術(shù)和時效性更新技術(shù)三方面的投入,提升數(shù)據(jù)建設(shè)能力。
由于醫(yī)療的問題的嚴肅性,夸克在健康大模型還對用戶問題進行產(chǎn)品上的分層處理,對偏嚴肅醫(yī)療方面的問題進行明確界定。“在產(chǎn)品上線前,我們針對回答效果進行了評價,在滿意度、準確度達到90%以上才會上線。”夸克健康運營負責(zé)人趙存忠對界面新聞表示。
接連推出高考志愿大模型和健康大模型,夸克AI業(yè)務(wù)的發(fā)展意圖不再局限于搜索,而是通過優(yōu)質(zhì)內(nèi)容吸引新用戶并獲得更好的用戶留存。夸克健康產(chǎn)品負責(zé)人姚垚向界面新聞透露,夸克每月有2000多萬的用戶會問健康問題,是非常大的比例。
趙存忠對界面新聞表示,夸克健康服務(wù)目前不考核商業(yè)化指標,考核的核心是對用戶需求回應(yīng)的滿意度,包括用戶的滿意度指標、用戶留存指標等多個維度。“如果真正解決了用戶的需求,用戶留存肯定是有增長的,過了半個月或者一個月遇到新的健康問題,肯定還會來搜索。”
在今年高考報志愿期間,夸克推出高考服務(wù)。官方公布的數(shù)據(jù)顯示,夸克高考服務(wù)4000萬用戶,生成超1200萬份“志愿報告”。但高考服務(wù)的目標用戶以及使用的周期都比較有限,相比之下,健康服務(wù)能夠服務(wù)的用戶規(guī)模和頻次都更高。
在阿里AI的新戰(zhàn)略下,夸克承載了“AI to C”的部分,也承擔(dān)了更大的用戶增長壓力。但在當下的市場格局下,搜索引擎不僅面臨著抖音、小紅書等內(nèi)容社區(qū)的挑戰(zhàn),也面臨著各類AI助手的分流。
夸克打出了AI搜索的牌,還需要提供更多差異化的能力,垂直模型和Agent服務(wù)是夸克重點的差異化探索方向。
徐健告訴界面新聞,學(xué)習(xí)和醫(yī)療是夸克的兩個重要戰(zhàn)略賽道,夸克通過垂直模型提供服務(wù)。在其他領(lǐng)域,目前夸克主要通過通用大模型來回答這些問題。“從技術(shù)原理角度來看,做垂類模型還是希望基于非常好的通用模型,不可能只會醫(yī)療別的不會。”
從目前的用戶增長來看,夸克的差異化競爭路線獲得了一定的成效。AI產(chǎn)品榜的數(shù)據(jù)顯示,今年6月,夸克以1.56億月活用戶超過豆包、DeepSeek等應(yīng)用,成為國內(nèi)總榜的第一名,月活用戶環(huán)比上月增長2.51%。
從長期來看,夸克仍需要穩(wěn)定的服務(wù)能力讓自身保持持續(xù)的競爭力。