達觀數據孫亞彬：如何做好非結構化數據文本智能審閱市場

2018-05-15 06:28

雖然是創業型公司，但因為在盛大、騰訊等知名科技公司所做的深厚積累，達觀數據備受市場青睞。目前，公司的主營業務立足于非結構化數據處理中的文本處理。2017年，公司營收同比增長3-4倍，達到盈虧平衡。作為數據界的“復旦系”，達觀數據是如何立足于數據市場的

致力于非結構化數據文本智能審閱市場

“雖然是一家創業型的公司，但實際上在專業領域達觀數據已經有了深厚積累。我們創始人陳運文博士，最早是在盛大文學，包括全國百分之七八十的小說文學網站數據的體系搭建都是由陳博團隊所領導的，這也成為騰訊文學的前身。后來，陳博帶領著這個團隊一同創辦了達觀數據。所以，雖然是創業型公司，我們在專業的挖掘上還是有深厚的積累。”對于達觀數據的創立背景，公司市場總監孫亞彬如是表示。

目前，達觀數據的業務主要立足于非結構化的文本數據處理。對于何謂非結構化文本，孫亞彬解釋說：“我們通常所理解的數據分析公司，大部分是處理結構化的數據。但事實上還有大量的，占到總量60%以上的非結構化數據，文本是非結構化數據中的一種，因為目前市場上大部分產品的處理能力還比較弱，所以還沒能把它很好的挖掘出來。”

其舉例說，在銀行的信貸部門，當有很多消費者申請借款，無論是提交的申請報告，還是銀行簽訂的合同，都需要進行大量的審計。用人工進行審核會耗費大量的時間和精力，而且因為人的精力有限，工作效率的降低，讓審計的準確率也隨之降低。但對于基于數據處理的機器來說，就可以避免這樣的問題，機器的效率會快很多，準確率也可以達到更高的水平。在達觀為國內知名保險公司提供的財務審閱系統中，財務信息提取準確率達高到98%。

“所以，我們提供的系統就是代替人做機械化和重復性的工作。機器可以自動閱讀文檔內容，閱讀合同，我們把關鍵核心信息進行提取，把可能存在的錯誤內容標識出來，這樣審核人員就不需要檢查整個文檔，只要看標注出來的可能存在的錯誤信息便可，大大減少了人員的處理時間，也提升了整個的工作流程效率。”

基于以上業務，達觀數據的文檔智能審閱系統可協助金融、制造、通信、法律、審計、媒體、政府多個行業的文字密集企業完成文檔審閱工作。

1 2 下一頁>

內容導航