首頁|必讀|視頻|專訪|運營|制造|監(jiān)管|芯片|物聯(lián)網|量子|低空經濟|智能汽車|特約記者
手機|互聯(lián)網|IT|5G|光通信|人工智能|云計算|大數(shù)據(jù)|報告|智慧城市|移動互聯(lián)網|會展
首頁 >> 移動互聯(lián)網 >> 正文

打破信息洪流:微算法科技(NASDAQ:MLGO)推出一種移動互聯(lián)網環(huán)境下數(shù)字媒體熱點挖掘算法

2025年9月8日 09:44  CCTIME飛象網  

在這個信息數(shù)據(jù)爆炸的時代,我們被海量資訊包圍。如何從紛繁復雜的網絡數(shù)據(jù)中提煉出有價值的熱點事件,已經成為眾多企業(yè)和數(shù)據(jù)統(tǒng)計、輿情與廣告等行業(yè)關注的焦點。近日,微算法科技(NASDAQ:MLGO)研發(fā)了一種面向移動互聯(lián)網環(huán)境的數(shù)字媒體熱點挖掘算法系統(tǒng)。該算法技術通過深度語義理解、主題建模、圖結構抽取與數(shù)據(jù)可視化等多項核心技術的融合,實現(xiàn)了熱點事件主題句的精準生成和事件趨勢的多維分析,成為大數(shù)據(jù)智能分析領域的重要技術突破。

近年來,隨著移動互聯(lián)網、社交媒體、短視頻平臺的普及,網絡內容的生產與傳播進入了指數(shù)級增長階段。每天產生的信息量以PB甚至EB為單位計數(shù),用戶很容易陷入“信息過載”的困境中。與此同時,突發(fā)事件、社會輿情、公眾情感表達、企業(yè)品牌動態(tài)等內容往往在龐大的數(shù)據(jù)流中一閃即逝,稍縱即逝。對于企業(yè)輿情監(jiān)控、媒體內容分發(fā)等場景來說,如何第一時間從雜亂信息中識別熱點事件并提取其核心句,是亟待解決的技術難題。

為此,微算法科技組織了一個以自然語言處理(NLP)和數(shù)據(jù)挖掘為核心的技術團隊,立足于當前主流文本處理技術瓶頸,設計并實現(xiàn)了一種創(chuàng)新性較強的熱點挖掘技術架構。這一架構不僅可用于海量文本的實時分析,而且支持移動互聯(lián)網下的不穩(wěn)定數(shù)據(jù)環(huán)境,適應性與實用性強。

系統(tǒng)的技術核心在于其獨創(chuàng)的“混合事件候選集構建算法”,該算法融合了“主題核心詞映射”與“事件三元組選取”兩個信息提取維度,通過雙向互補的策略實現(xiàn)事件主題句的高效生成。

在第一階段,微算法科技該算法技術利用改進的PAT-Tree技術提取文本集合中的高頻詞項。這些高頻詞往往是事件討論的核心標識,通過統(tǒng)計不同語料源(如微博、新聞評論、BBS)的詞頻分布,系統(tǒng)能精準捕捉輿論核心。隨后,將這些核心詞項通過語義映射的方式聯(lián)結至原始句子,從而提取出一組帶有強烈主題傾向的核心句。

第二階段,系統(tǒng)引入了事件三元組(事件主語-謂語-賓語)抽取技術,結合自然語言依存句法分析工具,將文本中的事件要素結構化;诮Y構化三元組,系統(tǒng)可快速定位具有完整事件結構的描述性句子。通過對這些句子進行相似度篩選和信息增益評估,生成另一組事件候選句。

最終,系統(tǒng)將來自兩種機制的候選句集合進行混合、去重,并引入關鍵詞覆蓋率、句子情感極性、實體命名密度等多維度特征進行排序,形成高質量的事件候選集,為后續(xù)建模做準備。

在完成候選集的初步構建后,系統(tǒng)引入了一種改進的詞圖模型——主服務通道模型(Main Service Channel, MSC),以解決傳統(tǒng)文本摘要模型中主題抽象不連貫、信息焦點分散的問題。

MSC模型本質上是一種帶權有向圖,其節(jié)點為候選集中出現(xiàn)的關鍵詞和實體名,邊則表示不同詞項之間的共現(xiàn)關系與語義相似性。構建詞圖后,系統(tǒng)通過圖遍歷策略識別出事件中最具代表性的路徑,即“主服務通道”,這些通道是圍繞某一熱點事件而自然形成的語義走向集合。

為了進一步提升抽取效果,微算法科技(NASDAQ:MLGO)在MSC模型中嵌入了事件時間序列特征和輿情強度因子,使得模型能動態(tài)調整路徑權重,從而在熱點爆發(fā)初期、中期、后期,分別聚焦不同的語義焦點,實現(xiàn)更具時效性與精準度的事件主題句提取。

該技術不僅是一個算法模型,更是一個完整落地可部署的熱點事件挖掘系統(tǒng)。系統(tǒng)采用模塊化微服務架構,分為數(shù)據(jù)采集層、文本處理層、算法計算層、可視化展現(xiàn)層四大部分。

數(shù)據(jù)采集層支持對多種數(shù)據(jù)源的接入,包括微博API接口、主流新聞網站RSS源、平臺評論區(qū)等。系統(tǒng)可內嵌自動采集策略,根據(jù)用戶設定的關鍵詞或事件類型,周期性抓取數(shù)據(jù)并進行分詞、清洗、去重等預處理操作。

文本處理層則完成自然語言處理相關任務,調用依存句法分析、實體識別、情感分析、三元組抽取等功能模塊,為后續(xù)事件候選集生成與MSC建模提供數(shù)據(jù)支持。

算法計算層部署了上述混合事件構建與MSC建模模塊,同時還包括事件熱度檢測模塊(基于關鍵詞突變檢測)、事件相似性聚類模塊(基于BERT語義向量表示)等功能,實現(xiàn)熱點的追蹤、合并與演化分析。

微算法科技該算法模型具備幾個顯著優(yōu)勢。首先,在數(shù)據(jù)源層面實現(xiàn)了多源異構內容的智能融合,不局限于單一平臺,保障了事件信息的全面性與多樣性。其次,在候選句提取層采用了語義雙機制(關鍵詞映射+三元組),在不依賴人工規(guī)則的前提下實現(xiàn)高質量主題句的自動生成。此外,MSC模型的引入極大提升了文本摘要的連貫性與主題聚焦度,使抽取句更符合人類認知習慣。整個系統(tǒng)支持事件級別的實時更新與動態(tài)推送,能夠在熱點初現(xiàn)時即刻捕捉并分析,為用戶提供第一時間的決策依據(jù)。

雖然當前系統(tǒng)已經具備較強的事件挖掘能力,但微算法科技并未止步于此。未來版本中,系統(tǒng)將引入多模態(tài)信息挖掘機制,實現(xiàn)圖文音視頻信息的融合分析。同時,將融合預訓練語言模型與知識圖譜,實現(xiàn)更深層的語義理解與推理能力。此外,微算法科技(NASDAQ:MLGO)還計劃將系統(tǒng)進一步開放成云服務平臺,供高校、研究機構、企業(yè)開發(fā)者進行二次開發(fā)與個性化集成,推動智能事件挖掘技術的標準化與產業(yè)化。

在大數(shù)據(jù)與人工智能加速融合的今天,如何從信息汪洋中撈取價值珍珠,成為決定組織競爭力的關鍵一環(huán)。微算法科技自主研發(fā)的熱點事件挖掘系統(tǒng),不僅在算法層面實現(xiàn)了突破,更在工程實現(xiàn)、實用性、可擴展性上形成了完整生態(tài),為數(shù)字輿情分析、智能決策支持提供了全新范式。

未來,隨著技術的不斷升級與拓展,該算法技術有望在智慧城市、數(shù)字政企、傳媒轉型等多個領域發(fā)揮更加深遠的影響。我們也期待這項技術在全球范圍內的廣泛應用,讓信息真正服務于人類的智慧與未來。

編 輯:T01
飛象網版權及免責聲明:
1.本網刊載內容,凡注明來源為“飛象網”和“飛象原創(chuàng)”皆屬飛象網版權所有,未經允許禁止轉載、摘編及鏡像,違者必究。對于經過授權可以轉載,請必須保持轉載文章、圖像、音視頻的完整性,并完整標注作者信息和飛象網來源。
2.凡注明“來源:XXXX”的作品,均轉載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網贊同其觀點和對其真實性負責。
3.如因作品內容、版權和其它問題,請在相關作品刊發(fā)之日起30日內與本網聯(lián)系,我們將第一時間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進行的“內容核實”、“商務聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權。
推薦新聞              
 
人物
中國移動董事長楊杰:激發(fā)數(shù)據(jù)要素潛能,共譜“AI+”時代華章
精彩視頻
飛象趣談第三十五期!為機器賦予“觸覺” 機器仿生手也會搭脈?
天地融合!中國衛(wèi)星通信開啟千萬用戶新時代
從煤炭之都到智算高地,山西轉型見證中國AI新基建崛起
聯(lián)想集團陳振寬:聚焦AI三大主線,以全棧AI能力布局,推動算力產業(yè)與智能化轉型
精彩專題
2025中國算力大會
ICT產業(yè)2025年中業(yè)績盤點
2025世界人工智能大會暨人工智能全球治理高級別會議
2025中國聯(lián)通合作伙伴大會
關于我們 | 廣告報價 | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網 CopyRight © 2007-2025 By CCTIME.COM
京ICP備08004280號-1  電信與信息服務業(yè)務經營許可證080234號 京公網安備110105000771號
公司名稱: 北京飛象互動文化傳媒有限公司
未經書面許可,禁止轉載、摘編、復制、鏡像