嫌棄ChatGPT數學太差，學而思曝自研數學大模型！

2023-05-06 18:17

ChatGPT數學太差了，數學AI還得看學而思！

跟自帶流量出道即巔峰的選秀新星一樣，ChatGPT一誕生就被全世界追捧，被競相效仿。誰都想借著這股東風，扶搖直上。各大科技公司聞風而動，陸續推出了相近的LLMs（大語言模型），一方面不愿甘居人后，錯過風口；一方面博出位，以便推動他們各自的核心業務。逐漸地，各行各業都開始參與其中。

現在輪到教育行業了！5月5日的消息，學而思正在進行自研數學大模型的開發工作，他們把這個數學大模型叫做MathGPT。MathGPT主攻數學領域的解題和講題算法，主要面向全球數學愛好者和科研機構。

據學而思透露，MathGPT為公司核心項目，由CTO田密負責。今年春節前，已啟動相應的團隊建設、數據、算力準備和技術研發，目前已取得階段性成果。此外，還將成立一支海外算法和工程團隊，在全球范圍內招募優秀的人工智能專家加入。

類ChatGPT們數學太差，學而思只好出手

像雨后春筍般涌現的大語言模型，在語言翻譯、摘要、理解和生成等任務上都有了接近“人”的水平，甚至有些地方比人的水平更高。

但是，唯獨在數學這塊上，無論是強如GPT—4、Bingchat，還是更年輕的文心一言、天工、式說3．0，或者是基于LLaMA開源而來的各類LLMs都表現得像智力“未開化”一樣。簡單的數學問題能答，稍微復雜一點就會自己把自己繞暈。有些題能做出正確答案，但是解題過程讓人看得一頭霧水。

嫌棄ChatGPT數學太差，學而思曝自研數學大模型！

更別說什么幾何代數、線性代數了，難為AI嘛這不是！用學而思的話來說，“通用語言模型更像一個‘文科生’”。

“這種不足是由LLM的自身特點決定的。”學而思AI團隊負責人介紹，LLM來自對海量語言文本的訓練，因此最擅長語言處理。行業內偏向基于LLM大模型做閱讀、寫作類應用，但如果想要在數學能力上有突破，就需要研發新的大模型。

學而思希望通過MathGPT彌補和攻克大語言模型的三個問題：第一，題目要解對，現在GPT結果經常出現錯誤；第二，解題步驟要穩定、清晰，現在GPT的解題步驟每次都不一樣，而且生成內容經常很冗余；第三，解題要講的有趣、個性化，現在GPT的解釋過于“學術”和機械，對孩子的學習體驗很不友好。

謀而后動。學而思能有這樣的底氣，一方面因為他們“靠數學起家”，另一方面由于他們在AI領域布局良久。早在2017年，學而思便成立了AI lab 人工智能實驗室。到目前為止，學而思已有20年的數學教學經驗，積累了龐大的數學相關數據，用來訓練數學模型水到渠成。

大勢所趨，教育行業擁抱AI

近日，美國在線教育龍頭Chegg股價幾近“腰斬”，暴跌50％！只是因為該公司CEO在不久前的財報電話會議上承認，“ChatGPT正開始從在線學習平臺Chegg手中奪取市場份額”。據統計，今年3月以來，學生對ChatGPT的興趣大增，對Chegg的產品興趣則減少。

而就在今年3月，Chegg宣布推出自己的人工智能聊天機器人CheggMate，由OpenAI最新、最先進的人工智能模型GPT－4支持。CheggMate可以隨時隨地回答學生的問題，且能保證準確性；還能針對不同的學生提供相應的測試。此外，CheggMate還可以跟學生交互，學生可以不斷追問，它會給出相應的解釋。

嫌棄ChatGPT數學太差，學而思曝自研數學大模型！

除了Chegg，同為教育領域的美國在線教育公司多鄰國（Duolingo）、可汗學院、Speak在此之前已經宣布接入OpenAI GPT—4，用以提升用戶體驗和提高教學工作效率以及學習效果。

2月份的時候，網易有道開始了AIGC（AI Generated Content人工智能自動生成內容）在教育場景的落地研發工作。在學而思宣布MathGPT的同一天，網易有道也公布了基于“子曰”大模型開發的AI口語老師相關視頻。據介紹，“子曰”為該網易有道自研的教育場景下的類ChatGPT模型，基于其研發的AI口語老師不同于以往機械發音的AI，其發音更像一個真實的老師。

在今天舉行的訊飛星火認知大模型成果發布會上，科大訊飛正式宣布推出“訊飛星火認知大模型”。科大訊飛董事長劉慶峰表示，星火認知大模型在多題型可解析數學能力上已領先ChatGPT。同時，推出首款搭載星火大模型的AI學習機T20pro。

嫌棄ChatGPT數學太差，學而思曝自研數學大模型！