在多媒體技術和互聯(lián)網(wǎng)高速發(fā)展的現(xiàn)在,高清晰度、大尺寸圖片越來越被人們所需要,然而高清晰度、大尺寸帶來的問題也隨之出現(xiàn):存儲圖像所需的空間成本大大增加,以及傳輸圖像所需的時間成本大幅攀升。
為了保證圖像失真盡可能少的情況下,用更少的網(wǎng)絡帶寬傳輸圖像或者用更少的空間存儲圖像,2023年初,我校章為川教授聯(lián)合青島認知人工智能研究院黃杰研究員提出了一個注意力再注意力的非線性變換端到端網(wǎng)絡架構(gòu)來代替線性變換作為圖像和視頻壓縮的主體架構(gòu)。該成果較好的應用于浙江某銀行業(yè)務單據(jù)壓縮,該行在全省有支行82個,網(wǎng)點大約4000個,平均每個支行每天產(chǎn)生的業(yè)務流水單據(jù)圖片數(shù)據(jù)量約20GB;總行擬對全省82家支行業(yè)務流水單據(jù)進行統(tǒng)一管理,通過對這些業(yè)務單據(jù)數(shù)據(jù)進行壓縮,降低支行到總行的傳輸帶寬投入,以及總行的存儲設備投入。每年為該銀行直接節(jié)省成本1217萬元。并且該成果已應用于三一重工昆山園區(qū)的視頻壓縮。該園區(qū)建設有視頻監(jiān)控7000路,且均為800萬超高清像素,視頻時長需保存90天,存儲投入成本巨大,經(jīng)壓縮系統(tǒng)壓縮后,微動態(tài)場景下,可將視頻碼率從4M壓縮到150K左右,復雜動態(tài)場景下,可將視頻碼率從4M壓縮到800K以內(nèi),畫質(zhì)肉眼無法區(qū)分;降低了廠區(qū)存儲成本投入以及前端網(wǎng)絡帶寬總費用節(jié)省近1000萬。
(核稿:強濤濤 編輯:劉倩)