你不知道计算机科学家做的8件事

| 2022年8月22日

在今年庆祝成立50周年的南加州大学信息科学研究所(USC’s Information Sciences Institute),对研究人员、学生和校友来说,研究不仅仅是0和1。

图片来源:谢尔盖·尼文斯/盖蒂图片社

图片来源:谢尔盖·尼文斯/盖蒂图片社

1.带领NBA球队获得总冠军

你有没有发现自己在看湖人队的比赛时,会想:“勒布朗投进这个球的几率有多大?”

现在,感谢Yu-Han Chang和Rajiv Maheswaran,你可以真正找到答案!这两位前计算机科学家在南加州大学的信息科学研究所ISI)接受了量化篮球比赛的挑战。

他们使用相机数据和机器学习来分析NBA篮板球2012而且2014这两篇论文都在著名的麻省理工学院斯隆体育分析会议上获得了“最佳论文”。2013年,该团队获得了南加州大学维特比工程学院的最高荣誉和5万美元bob国际首页登录Maseeh创业奖竞赛-一个工程商业计划竞赛来提供帮助bob国际首页登录南加州大学维特比分校的学生、教师和其他人将他们的创新理念从大学带到市场。

他们去了市场!开始的时候获奖研究论文和商业计划,已经成为体育AI,球员跟踪,分析和数据可视化服务的首要公司第二个频谱.Second Spectrum由Chang、Maheswaran和Jeff Su共同创立,他们构建的系统可以通过专业教练的视角看待体育,从跟踪数据中提取超出人类观察范围的见解,并为教练、球员、联盟和媒体提供工具,以利用这些分析。

马赫斯瓦兰表示:“从最简单的事情,比如快速获取球员在比赛中的所有射门和传球,到识别深刻的战略见解,我们才刚刚开始触及可能性的表面。”

职业体育联盟也注意到了这一点!Second Spectrum是NBA、美国职业足球大联盟和英超(足球)的主要体育分析公司,于2021年被Genius sports收购。


2.与纽约警察局一起遏制性交易

根据大多数最近报告论现代奴隶制根据国际劳工组织的数据,2016年全球有480万人——几乎全是女性——成为性贩运的受害者。

数据显示,大部分都是从网上开始的。

自2013年以来,三军情报局人员一直在利用知识图谱和人工智能来打击性交易,分析这个阴暗而残酷的行业在网上的足迹。研究助理教授玛雅是个大好还有他的团队,包括克雷格KnoblockISI的执行董事迈克尔·凯斯顿(Michael Keston)开发了一种系统该公司在网上搜索色情广告的关键词、短语和活动,以表明可能存在性交易活动。他们的工作后来被纽约警察局(NYPD)和200多个执法机构部署。

“我们的研究产生了相当大的影响,”Kejriwal说。“人口贩运受害者获救,人贩子受到起诉,证据来自我们的系统。”从那时起,他就把他的研究成果用于网络科学建立地下贩运网络模型,为未来的研究和政策改变铺平道路。


3.把圣经翻译成你从未听说过的语言

乔尔·马修他在印度长大,父母都从事圣经翻译工作。

Mathew说:“我觉得软件技术可以在很多领域加速、改进、支持和帮助他们。”“看到圣经被翻译成各种语言是我的热情之一。”

ISI是他在2015年加入南加州大学的主要原因,因为它强大的自然语言处理小组和低资源机器翻译的工作。在ISI的时候,马修遇到了一位资深的研究科学家Ulf Hermjakob在人工智能部门。这是一场天作之合,因为他们都对自己的基督教信仰充满热情,对低资源机器翻译也很感兴趣。

Hermjakob解释说:“人们没有意识到世界上大约有7100种语言。谷歌Translate涵盖了大约100个。”他继续说,“对于这个圣经翻译,我们的目标是资源非常低的语言,甚至不在前500名之内。”

这对搭档已经开始了一项雄心勃勃的研究项目,他们使用一种新颖的工具,将一种不常见的语言中的单词与一种更常见的语言中的单词进行匹配。他们的目标是最终为任何语言的人工翻译人员提供拼写检查、单词和短语选择以及不准确的识别,以确保准确、一致和高效的翻译。


4.警告德州人致命的山洪暴发

在德克萨斯州北部的达拉斯-沃斯堡(DFW)大都市,每年死于山洪暴发的人比任何其他类型的恶劣天气都要多。

自2008年以来,NOAA(国家海洋和大气管理局)和国家气象局在DFW使用了一个暴洪预测系统,该系统包含了诸如土壤湿度和温度、渗透性、植被和驱动因素:降雨等参数。

多年来,这些输入在准确性和容量上都有所增加,导致了一个问题:数据太多了!

输入珀加索斯-由ISI研究教授Ewa Deelman和她的同事创建的工作流管理系统ISI团队,这使得来自马萨诸塞大学阿默斯特分校和德克萨斯大学阿灵顿分校的合作者能够处理这些大量的数据。

通过Pegasus,两个降水数据来源被输入到模型中,同时还有大量的输入参数。该模型输出流量、径流和时间框架估计,对暴洪预测有价值。此外,重要的是,它还允许对结果进行映射。

当地图上的区域超过设定的阈值时,它会触发有针对性的暴洪警报,发送给风险区域的人们,以及城市应急管理人员和雨水管理人员。在ISI研究人员的帮助下,DSW的暴洪预测系统现在更快、更准确、更能挽救生命。


5.帮助你找到下一份工作

你看到所有该看的招聘广告了吗?

不幸的是,对于某些种族和性别来说,答案可能是没有.根据美国法律,招聘广告可以根据资历定位,但不能根据性别或种族等受保护的阶层定位。然而,多项研究表明,由于内容排名算法,Facebook、谷歌和LinkedIn等社交网络平台上的广告投放可能会因性别或种族而倾斜。

ISI的一个团队开发了一种方法用于按性别识别非法倾斜,同时保护用户隐私和平台的算法。

南加州大学研究教授约翰·海德曼说:“这些平台投资了数百万美元来构建最好的算法,所以他们不会分享源代码。”这项由Heidemann、Aleksandra Korolova和Baslieal Imana进行的研究,为针对受保护阶层偏见的外部审计铺平了道路——这可能在未来的某个时候由联邦法律强制执行,因为已经提出了相关立法。


6.计算艺术风格

是什么让蒙娜丽莎的微笑如此神秘?

总有一天,我们可能会有一个定量的答案,这要感谢视觉文体学的进步,这是一个使用计算机科学方法的领域——想想:人工智能和机器学习——艺术史和认知科学来量化艺术风格。

前ISIer里基·j·塞西认识到这个领域的需要。

对于那些对分析一件艺术品最感兴趣的人——学生、学者和艺术家自己——视觉风格学程序和发现是无法访问的,所以他和他的团队进行了创作WAIVS(图像分析和视觉文体学工作流程)。他们使用了平台Sethi在ISI工作时研究的一个工具,是由ISI首席科学家Yolanda Gil开发的。这是一个计算实验平台,包括一个人工智能组件,以帮助非专家理解实验。Sethi说:“我们正在为人文和艺术研究人员定制这个现有的工具。”

不出所料,有很多人对这个项目感兴趣。心理学家正试图用它来解密艺术品的哪些方面会引发我们的心理反应。学生和非专业人士用它来理解艺术作品,并对艺术流派和艺术家进行分类。

“许多研究人员,”塞西说,“都在关注这个问题:‘我们真的能量化并提出艺术风格的数学表示吗?’”


7.菜单上有沙拉

ISI的研究助理教授阿比盖尔·霍恩(Abigail Horn)说:“不良饮食是全球心血管疾病和死亡率的主要原因。”“因此,我们在改善饮食方面所做的任何事情都将对公众健康产生重大影响。”

霍恩和她的团队已经开始在他们目前对快餐店的研究中产生这种影响。研究小组发现,人们的饮食环境——他们能接触到的食物类型或餐馆——会影响他们的饮食。不仅是他们家周围的食物,还有他们一天中遇到的食物出口,团队可以通过它们进入手机移动数据.研究人员将这些信息与健康数据联系起来,表明食物环境与饮食相关疾病密切相关。这项研究更进一步,分析了餐馆的菜单,以确定社区中确切的食物。

霍恩说:“如果我们想衡量人们去的餐馆类型如何预测他们的饮食健康,我们需要知道他们在那里实际上能吃到什么食物。”

这个团队数字化菜单以及从语言处理技术开发出一种工具来表征餐厅菜单的营养质量。这项研究可以为受不良饮食影响的人口群体制定更有效的公共卫生政策或干预措施铺平道路。

霍恩举了一个例子。因为我们看到El Pollo Loco的菜单比Taco Bell健康得多,也许他们吸引了相似的人群,一种干预措施是用El Pollo Loco取代Taco Bell。或者制定激励措施或政策,让塔可钟需要提供更多某种更健康的选择。”

再见,芝士戈迪塔脆脆至尊!


8.为工程肾脏铺平道路

在美国,肾脏疾病是第九大死亡原因,不幸的是,治疗方案可能很艰难,缺乏或无效。重建受伤或患病的现有肾脏,并最终使新肾脏的工程成为可能,是一组研究人员的最终目标南加州大学凯克医学院和三军情报局。

目前围绕这一问题的科学很有前景,但需要大量数据以及研究人员之间的合作,这可能具有挑战性。

解决方案?DERIVA-一种由ISI主管卡尔·凯塞尔曼开发的软件程序信息系统研究部William M. Keck工程主席。

衍生工具可以管理大的科学数据这种情况下包括实验结果、组织样本、基因表达数据和来自高分辨率显微镜的图像。通过衍生工具,数据被收集、组织、使用并提供给生物医学界的其他人。该团队认为,在众多研究小组之间进行协调、自适应和互动的研究项目是快速推进肾脏再生研究的最佳途径。

Kesselman说:“只需点击一下,derivatives的读者就可以获得他们探索结果和自己重现实验所需的一切。”

出版于2022年8月22日

最后更新于2022年10月21日

分享这个故事