近来 ,传音在。多媒队揽核算机视觉。体团挑战范畴最具影响力的两项世界比赛 CVPR N 。TI。赛冠RE 2025中 ,亚军传音多媒体团队与上海交通大学图画所MediaLab联合团队别离斩获。传音高效超分辨率挑战赛(NTIRE 2025 Efficient Super-Resolution Challenge)第一名,多媒队揽短。体团挑战视频。两项UGC图画超分辨率挑战赛(NTIRE 2025 Short-form UGC Image Super-Resolution Challenge)第二名 。赛冠 ,亚军展示了传音在视频画质范畴的传音深沉堆集与抢先实力。
CVPR NTIRE(New Trends in Image Restoration and 多媒队揽Enhancement)是核算机视觉顶会CVPR(Conference on Compu。te。体团挑战r Vision and Pattern Recognition)旗下极具影响力的世界学术比赛 ,素有“印象。算法。奥林匹克”之称 。该赛事聚集视频恢复 、图画增强、生成技能及质量评价等底层视觉使命,旨在推进技能打破并处理实践使用难题 。本年的赛事设置了多项挑战赛,招引了全球顶尖科研与工业部队参与。
传音深耕非洲、南亚等新式商场多年,一直环绕用户需求进行本地化立异。近年来数字媒体飞速发展,传音洞悉到用户对。智能手机。图画和视频本质提出了更高的要求 。据Dataspark的数据显现,2024年非洲用户月均在交际、视频类App上花费约52小时,但是非洲用户观看视频在线播映网速均匀不到10M/S ,观看体会较差。面临非洲等方针商场存在的网速慢、流量贵等实际问题,传音继续投入资源,与上海交通大学图画所MediaLab深化协作,研制轻量化、低功耗、高功用的画质增强技能 ,让更多用户在有限条件下也能享用高清视觉体会 。
▍技能成果一 。
高效图画超分辨率中的蒸馏监督下的卷积低秩习惯。
在高效超分辨率挑战赛中,传音多媒体团队和上海交通大学图画所MediaLab提交的论文。“高效图画超分辨率中的蒸馏监督下的卷积低秩习惯(Distillation-Supervised Convolutional Low-Rank。 Ad。aptation for Efficient Image Super-Resolution)” 。提出DSC 。LoRA 。技能,其学习大言语模型中的低秩习惯并结合常识蒸馏战略 ,在不添加核算成本的前提下明显提高了高效超分辨率模型的功用 。
多个基准数据集上的试验结果表明DSCLoRA在模型复杂度和功用表现之间完成了超卓的均衡 。在不添加模型体积和核算开支的前提下,DSCLoRA可以大幅提高图画超分辨率作用,提高弱网环境下视频通话与流媒体播映清晰度,一起具有推理速度快