釘釘 AI 功能多模態升級 能根據圖片識人、翻譯、

2026-03-27 11:04:06 來源:環球網 閱讀數:938

【環球網報道 記者 李文瑤】3月28日,釘釘 AI 助理宣布升級,上線圖片理解、文檔速讀、工作流等產品能力,探索多模態、長文本與 RPA 技術在 AI 應用的落地。基於阿裏通義千問大模型,升級後的釘釘 AI 助理擁有更強的視覺推理能力和長文本速讀能力。目前,用戶在釘釘 IM 消息框或點擊魔法棒按鈕進入 AI 助理對話框,發送長文件、在線文檔、網頁鏈接、視頻內容,即可根據內容識人、識地點、分析、答題、翻譯、摘要、提取文字,甚至可以通過多輪交互進一步做智能問答。

具體來看,基於通義千問 Qwen-VL-Max 視覺理解模型,釘釘 AI 助理能夠準確描述和識別圖片信息,並根據圖片進行信息推理、擴展創作、文字提取、翻譯等,相當於一個全能的“圖片小百科”。

同時,通義千問 Qwen-VL-Max 擁有更強的視覺推理和中文理解能力。此外,AI 助理也支持視頻內容的速讀。發送給 AI 助理的短視頻、直播切片或培訓視頻可以被快速“觀看”, AI 助理會根據視頻內容生成字幕,提取關鍵詞,並生成一份智能摘要,對於最高 2GB 的視頻內容,僅需 3 分鍾即可完成智能解讀。

基於通義千問大模型,釘釘 AI 助理可以快速閱讀本地文件如 Word、PDF、PPT、Excel 等、釘釘文檔、網頁鏈接等多種格式文件,輕鬆解析各類學術論文、產品手冊、使用教程、數據表格、新聞報道、多國語言的圖書等。

目前,隨著 OpenAI 帶火 Agent(智能體),大模型融入自動化技術成為當前最具共識的方向之一。今年1月,釘釘 AI 助理正式上線,企業和個人 AI 助理已進入到工作和生產力場景中。為讓 AI 助理可以完成一係列更複雜的任務,釘釘 AI 助理上線了工作流能力。

工作流是 AI Agent 的一種進階玩法,不僅可以在創建時對 AI 執行任務的流程進行拆解和編排,使得 AI 助理可以主動接管完成相應操作,還能夠打通外部的係統數據和 API 能力,進一步擴展了它的行動能力,比如搭建能自動寫腳本並生成視頻的創作 AI 助理。

為(wei)降(jiang)低(di)用(yong)戶(hu)的(de)使(shi)用(yong)門(men)檻(kan),釘(ding)釘(ding)官(guan)方(fang)還(hai)提(ti)供(gong)了(le)多(duo)種(zhong)工(gong)作(zuo)流(liu)模(mo)板(ban)。已(yi)有(you)企(qi)業(ye)使(shi)用(yong)工(gong)作(zuo)流(liu)創(chuang)建(jian)了(le)門(men)店(dian)信(xin)息(xi)收(shou)集(ji)助(zhu)理(li),將(jiang)用(yong)戶(hu)反(fan)饋(kui)自(zi)動(dong)化(hua)整(zheng)理(li),並(bing)存(cun)儲(chu)到(dao)一(yi)張(zhang)釘(ding)釘(ding)多(duo)維(wei)表(biao)中(zhong),幫(bang)助(zhu)員(yuan)工(gong)節(jie)約(yue)瑣(suo)碎(sui)的(de)時(shi)間(jian);個人用戶也通過連接微博 API,創建了自動追蹤熱點並撰寫文章的助理,一個指令就能批量執行,大幅提升內容生產的效率。

目前,用戶可在釘釘 APP 或 PC 客戶端直接使用 AI 助理的各項功能,包括多模態、長文本和工作流。

0.061667s