CAC Atelier | 电子梦话:初探自然语言处理
自然语言处理(NLP)是人工智能的一个领域,使计算机得以一种智能且有效用的方式从人类语言中分析、理解并获取含义。通过利用NLP,开发人员可以组织和构建知识,以执行自动总结、翻译、语音识别和主题分割等任务。
NLP专家约翰·雷林(John Rehling)在《自然语言处理如何帮助揭示社交媒体的情绪(How Natural Language Processing Helps Uncover Social Media Sentiment)》一书中说:“除了普通的文字处理器操作将文本视为单纯的符号序列外,NLP考虑了语言的层次结构:几个词组成一个短语,几个短语组成一个句子;最终,句子传达了思想。”
NLP被用来分析文本,使机器能够理解人类如何说话。这种人机互动使一些现实应用成为可能,如自动文本总结、情感分析、主题提取、命名实体识别(NER,named entity recognition)、词性标注、关系提取(relationship extraction)、词干提取(stemming)等等。NLP也通常被用于文本挖掘、机器翻译和智能问答。
在本次工作坊中,CAC展览“人工智能的兑现:卑弃”参展艺术家贺子珂和技术导师高鹏飞将结合他们的实践,对人工智能自然语言处理中的预训练模型之基本原理及常见类型进行介绍。学员们也将学习从系统环境配置开始运行一次基于TensorFlow和GPT-2 simple的语句生成程序,最终输出一段“机器人独白”。同时,学员们还将在导师的指导下,尝试从独白中提取角色信息,编辑成不同的故事。工作坊也将对信息和数据时代的关联紊乱症(Apophenia)展开一定的讨论。
贺子珂,《电子梦:我们将如此继续》,2018 ©艺术家
贺子珂
贺子珂是一位艺术家。她的作品关注信息流动下个体的感知与命运,以及叙事和意义的不确定性。近期项目围绕特定的数据、记忆和素材库展开,探索数字和消费生活中的模式、愿景与想象。媒介包括影像、文本、装置、计算机程序等。http://www.hezike.cn/
高鹏飞
高鹏飞,算法工程师。毕业于清华大学电子工程系,获硕士学位。曾任职于谷歌中国,微软必应等,现为Hulu北京的研究开发工程师。曾参与写作《百面深度学习》等书籍。他的工作围绕数据分析,搜索,用户推荐,自然语言处理等内容展开。