当今社会,人们的交往更多地始于人机交互,例如首先与手机对话。人机交互正是这样一门学问,即人与计算机之间使用某种对话语言,以一定的交互方式,完成确定任务的人与计算机之间的信息交换过程。
依托清华大学计算机科学与技术系建设的网络多媒体北京市重点实验室,将人机交互作为研究方向之一。该实验室还在媒体高效计算、媒体大数据等多个跨学科研究方向上开展了诸多工作,致力于让人们在网络中的生活更加快捷、便利。
完善人机交互体验
来到实验室,这里的科研人员大多对着电脑,敲击键盘写下一行行代码。这当然不是普通的代码,充满想象力的人机交互新形态就在这些代码中产生。
“我们为什么会多花上几千块钱,去买苹果手机?”实验室副研究员喻纯拿起智能手机反复滑动、点击触摸屏。手机和手机之间的差距,就体现在滑动是否流畅、点击是否灵敏、误触是否能避免等这些人机交互体验上。创造更聪明的人机交互界面,便是喻纯和同事们的主要工作。
实验室人员正在演示人机交互体验
实验室与华为开展合作,研究优化智能手机交互体验的AI算法。其中,自2017年上半年启动研发的防误触方法,已经在华为最新手机上得到应用,可有效降低误触率十倍以上。
同时,他们开发了针对盲人用户的智能输入法。研究人员采集代表盲人点击屏幕习惯的数据,将类似的智能算法应用于专门为盲人开发的智能输入法中。
目前,实验室还在开发利用增强现实的眼镜实现二人下棋情景。“二人各有一个棋盘,各执半幅棋子,自己下自己的棋,从眼镜中能真切地看到3D画面,下棋的人就坐在面前。”喻纯描述着这即将成为现实的图景。
提高视频收看质量
当前,互联网已经进入视频时代,视频流量已经占据了整个网络流量的70%。用户点击网页中的视频,就可以通过互联网从视频提供商的服务器上通过流式传输观看视频内容。
实验室副主任孙立峰教授介绍,2001年前后,互联网刚刚使用P2P的原理分发视频内容时,从点击到开始观看,至少需要20多秒的缓冲时间,中间也经常出现持续数秒的卡顿。实验室在P2P流媒体传输优化、基于用户行为感知的CDN视频内容分发和利用云数据中心支持大规模视频分发等方面,也做出了系列创新工作。
近年来,为降低首屏和卡顿时间,提高视频观看的用户体验,实验室研究人员在数据驱动的边缘网络内容分发方面取得进展。例如,研究人员提出一种边缘资源组织算法,利用不同区域用户的偏好,以及用户请求和智能路由器在该区域的分布,对区域进行划分,每个区域内路由器通过协作的方式共享内容,从而达到提升用户体验并减少中心服务器负载的目的。对此,他们通过设计主动和被动的测量实验,对优酷智能路由CDN进行了深入的测量分析,观察系统如何调度边缘设备去缓存视频来为用户服务,最终提出了新的基于“局部流行度感知的边缘视频内容部署”策略。
同时,实验室围绕改善立体图像显示效果,构建了重定立体图像数据集,并在此基础上提出了基于学习的立体图像重定质量客观评价方法。在360°全景视频拼接方面,研究人员引入时域学习,改进了视频拼接过程中时域保持稳定,不出现闪烁等情况,提高了视频拼接质量。
挖掘感知社交情感
围绕网络社交媒体,实验室则采用数据挖掘的手段,对社交网络中的诸多特征进行了分析。
“打开手机,我们每个人都在多个微信群里。那么,这些群到底怎么样形成和发展的?”孙立峰介绍。为了发现群组形成、生长和演化的内在规律,实验室崔鹏副教授课题组与腾讯公司合作,分析了微信群的日志数据,对群组的生长和进化进行了建模,能够很好地预测群组演化的趋势。
对于公众情感在社交网络中的传播现象,以及各个社会角色(具体包括意见领袖、结构洞用户及普通用户)与情感传播过程之间的关联关系。研究人员提出了社会角色感知的情感传播模型,能够细粒度地刻画每位用户在情感传播过程中的行为决策。这些研究将助推网络社交媒体的应用更好地满足用户需求。
立足北京辐射全国
2016年发布的《北京加强全国科技创新中心建设总体方案》中明确提出,打造世界知名科学中心,要加强原始创新,要推进新兴交叉学科建设。网络数据科学作为重要科学前沿,也被写进了这一方案中。
据了解,该实验室学科方向涵盖计算机科学与技术、社会学、传播学等学科,具有跨学科交叉互补的优势,统筹多个学科,努力为建设北京全国科技创新中心服务。
多年来,实验室围绕北京市重点实验室的建设发挥在那要求,将研究成果应用于推进北京全国科技创新中心建设中,并向全国范围内辐射。
此外,实验室还在媒体高效计算方面与北京四达时代开展合作,将高效HEVC编转码技术进行产业化;媒体内容分发方面与北京世纪鼎点开展合作,结合3D视频编码器等相关成果,在央视开展了国内首次互联网大规模3D视频直播应用示范,为首都经济社会发展起到了支撑引领作用。
|