嫌棄ChatGPT數學太差,學而思曝自研數學大模型!
ChatGPT數學太差了,數學AI還得看學而思!

跟自帶流量出道即巔峰的選秀新星一樣,ChatGPT一誕生就被全世界追捧,被競相效仿。誰都想借著這股東風,扶搖直上。各大科技公司聞風而動,陸續推出了相近的LLMs(大語言模型),一方面不愿甘居人后,錯過風口;一方面博出位,以便推動他們各自的核心業務。逐漸地,各行各業都開始參與其中。
現在輪到教育行業了!5月5日的消息,學而思正在進行自研數學大模型的開發工作,他們把這個數學大模型叫做MathGPT。MathGPT主攻數學領域的解題和講題算法,主要面向全球數學愛好者和科研機構。
據學而思透露,MathGPT為公司核心項目,由CTO田密負責。今年春節前,已啟動相應的團隊建設、數據、算力準備和技術研發,目前已取得階段性成果。此外,還將成立一支海外算法和工程團隊,在全球范圍內招募優秀的人工智能專家加入。
類ChatGPT們數學太差,學而思只好出手
像雨后春筍般涌現的大語言模型,在語言翻譯、摘要、理解和生成等任務上都有了接近“人”的水平,甚至有些地方比人的水平更高。
但是,唯獨在數學這塊上,無論是強如GPT—4、Bingchat,還是更年輕的文心一言、天工、式說3.0,或者是基于LLaMA開源而來的各類LLMs都表現得像智力“未開化”一樣。簡單的數學問題能答,稍微復雜一點就會自己把自己繞暈。有些題能做出正確答案,但是解題過程讓人看得一頭霧水。

更別說什么幾何代數、線性代數了,難為AI嘛這不是!用學而思的話來說,“通用語言模型更像一個‘文科生’”。
“這種不足是由LLM的自身特點決定的。”學而思AI團隊負責人介紹,LLM來自對海量語言文本的訓練,因此最擅長語言處理。行業內偏向基于LLM大模型做閱讀、寫作類應用,但如果想要在數學能力上有突破,就需要研發新的大模型。
學而思希望通過MathGPT彌補和攻克大語言模型的三個問題:第一,題目要解對,現在GPT結果經常出現錯誤;第二,解題步驟要穩定、清晰,現在GPT的解題步驟每次都不一樣,而且生成內容經常很冗余;第三,解題要講的有趣、個性化,現在GPT的解釋過于“學術”和機械,對孩子的學習體驗很不友好。
謀而后動。學而思能有這樣的底氣,一方面因為他們“靠數學起家”,另一方面由于他們在AI領域布局良久。早在2017年,學而思便成立了AI lab 人工智能實驗室。到目前為止,學而思已有20年的數學教學經驗,積累了龐大的數學相關數據,用來訓練數學模型水到渠成。
大勢所趨,教育行業擁抱AI
近日,美國在線教育龍頭Chegg股價幾近“腰斬”,暴跌50%!只是因為該公司CEO在不久前的財報電話會議上承認,“ChatGPT正開始從在線學習平臺Chegg手中奪取市場份額”。據統計,今年3月以來,學生對ChatGPT的興趣大增,對Chegg的產品興趣則減少。
而就在今年3月,Chegg宣布推出自己的人工智能聊天機器人CheggMate,由OpenAI最新、最先進的人工智能模型GPT-4支持。CheggMate可以隨時隨地回答學生的問題,且能保證準確性;還能針對不同的學生提供相應的測試。此外,CheggMate還可以跟學生交互,學生可以不斷追問,它會給出相應的解釋。

除了Chegg,同為教育領域的美國在線教育公司多鄰國(Duolingo)、可汗學院、Speak在此之前已經宣布接入OpenAI GPT—4,用以提升用戶體驗和提高教學工作效率以及學習效果。
2月份的時候,網易有道開始了AIGC(AI Generated Content人工智能自動生成內容)在教育場景的落地研發工作。在學而思宣布MathGPT的同一天,網易有道也公布了基于“子曰”大模型開發的AI口語老師相關視頻。據介紹,“子曰”為該網易有道自研的教育場景下的類ChatGPT模型,基于其研發的AI口語老師不同于以往機械發音的AI,其發音更像一個真實的老師。
在今天舉行的訊飛星火認知大模型成果發布會上,科大訊飛正式宣布推出“訊飛星火認知大模型”。科大訊飛董事長劉慶峰表示,星火認知大模型在多題型可解析數學能力上已領先ChatGPT。同時,推出首款搭載星火大模型的AI學習機T20pro。

還有鉛筆、金太陽、高途等教育相關企業投入AI研發和運用。
相比較之下,學而思選擇的道路和其他人有所不同,不基于現有LLM做微調和接口調用、不做通用LLM,而是自研基于專業領域的“數學大模型”MathGPT。而MathGPT較之其他的路徑孰優孰劣,還是要看落地后的實際應用。
教育行業基于AI,開始了新一輪的改變和進化。教育行為中人和AI的關系也進入到了一個全新的階段,AI能不能最終滿足教育行業的殷切期盼,還有待時間驗證。
請輸入評論內容...
請輸入評論/評論長度6~500個字


分享













