凤凰快三-凤凰快三
凤凰快三1672-10-23

向善而生的AI助盲,让AI多一点,障碍少一点******

  有人说,盲人与世界之间,相差的只是一个黎明。在浪潮信息研发人员的心中,失去视力的盲人不会陷入永夜,科技的进步正在力图给每一个人以光明未来。

  AI助盲在人工智能赛道上一直是最热门的话题之一。以前,让失明者重见光明依靠的是医学的进步或“奇迹”。而随着以“机器视觉+自然语言理解”为代表的多模态智能技术的爆发式突破,更多的失明者正在借助AI提供的感知、理解与交互能力,以另一种方式重新“看见世界”。

  新契机:多模态算法或将造福数以亿计失明者

  科学实验表明,在人类获取的外界信息中,来自视觉的占比高达70%~80%,因此基于AI构建机器视觉系统,帮助视障患者拥有对外界环境的视觉感知与视觉理解能力,无疑是最直接有效的解决方案。

  一个优秀的AI助盲技术,需要通过智能传感、智能用户意图推理和智能信息呈现的系统化发展,才能构建信息无障碍的交互界面。仅仅依靠“一枝独秀”超越人类水平的单模态人工智能比如计算机视觉技术还远远不够,以“机器视觉+自然语言理解”为代表的多模态算法的突破才是正确的新方向和新契机。

  多个模态的交互可以提升AI的感知、理解与交互能力,也为AI理解并帮助残障人士带来了更多可能。浪潮信息研发人员介绍说,多模态算法在AI助盲领域的应用一旦成熟,将能够造福数以亿计的失明者。据世卫组织统计,全球至少22亿人视力受损或失明,而我国是世界上盲人最多的国家,占世界盲人总数的18%-20%,每年新增的盲人数量甚至高达45万。

  大挑战:如何看到盲人“眼中”的千人千面

  AI助盲看似简单,但多模态算法依然面临重大挑战。

  多模态智能算法,营造的是沉浸式人机交互体验。在该领域,盲人视觉问答任务成为学术界研究AI助盲的起点和核心研究方向之一,这项研究已经吸引了全球数以万计的视障患者参与,这些患者们上传自己拍摄的图像数据和相匹配的文本问题,形成了最真实的模型训练数据集。

  但是在现有技术条件下,盲人视觉问答任务的精度提升面临巨大挑战:一方面是盲人上传的问题类型很复杂,比如说分辨冰箱里的肉类、咨询药品的服用说明、挑选独特颜色的衬衣、介绍书籍内容等等。

  另一方面,由于盲人的特殊性,很难提取面前物体的有效特征。比如盲人在拍照时,经常会产生虚焦的情况,可能上传的照片是模糊的或者没有拍全,或者没拍到关键信息,这就给AI推理增加了难度。

  为推动相关研究,来自卡内基梅隆大学等机构的学者们共同构建了一个盲人视觉数据库“VizWiz”,并发起全球多模态视觉问答挑战赛。挑战赛是给定一张盲人拍摄的图片和问题,然后要求给出相应的答案,解决盲人的求助。

  另外,盲人的视觉问答还会遭遇到噪声干扰的衍生问题。比如说,盲人逛超市,由于商品外观触感相似,很容易犯错,他可能会拿起一瓶醋却询问酱油的成分表,拿起酸奶却询问牛奶的保质期等等。这种噪声干扰往往会导致现有AI模型失效,没法给出有效信息。

  最后,针对不同盲人患者的个性化交互服务以及算法自有的反馈闭环机制,同样也是现阶段的研发难点。

  多解法:浪潮信息AI助盲靶向消灭痛点

  AI助盲哪怕形式百变,无一例外都是消灭痛点,逐光而行。浪潮信息多模态算法研发团队正在推动多个领域的AI助盲研究,只为帮助盲人“看”到愈发精彩的世界。

  在VizWiz官网上公布的2万份求助中,盲人最多的提问就是想知道他们面前的是什么东西,很多情况下这些物品没法靠触觉或嗅觉来做出判断,例如 “这本书书名是什么?”为此研发团队在双流多模态锚点对齐模型的基础上,提出了自监督旋转多模态模型,通过自动修正图像角度及字符语义增强,结合光学字符检测识别技术解决“是什么”的问题。

  盲人所拍摄图片模糊、有效信息少?研发团队提出了答案驱动视觉定位与大模型图文匹配结合的算法,并提出多阶段交叉训练策略,具备更充分的常识能力,低质量图像、残缺的信息,依然能够精准的解答用户的求助。

  目前浪潮信息研发团队在盲人视觉问答任务VizWiz-VQA上算法精度已领先人类表现9.5个百分点,在AI助盲领域斩获世界冠军两项、亚军两项。

  真实场景中的盲人在口述时往往会有口误、歧义、修辞等噪声。为此,研发团队首次提出视觉定位文本去噪推理任务FREC,FREC提供3万图片和超过25万的文本标注,囊括了口误、歧义、主观偏差等多种噪声,还提供噪声纠错、含噪证据等可解释标签。同时,该团队还构建了首个可解释去噪视觉定位模型FCTR,噪声文本描述条件下精度较传统模型提升11个百分点。上述研究成果已发表于ACM Multimedia 2022会议,该会议为国际多媒体领域最顶级会议、也是该领域唯一CCF推荐A类国际会议。

  在智能交互研究方面上,浪潮信息研发团队构建了可解释智能体视觉交互问答任务AI-VQA,同时给出首个智能体交互行为理解算法模型ARE。该研究成果已发表于ACM Multimedia 2022会议。该研究项目的底层技术未来可广泛应用于AI医疗诊断、故事续写、剧情推理、危情告警、智能政务等多模态交互推理场景。

  眼球虽然对温度并不敏感,但浪潮信息的研发团队,却在努力让盲人能“看”到科技的温度,也希望吸引更多人一起推动人工智能技术在AI助盲、AI反诈、AI诊疗、AI灾情预警等更多场景中的落地。有AI无碍,跨越山海。科技的伟大之处不仅仅在于改变世界,更重要的是如何造福人类,让更多的不可能变成可能。当科技成为人的延伸,当AI充满人性光辉,我们终将在瞬息万变的科技浪潮中感受到更加细腻温柔的善意,见证着更加光明宏大的远方。

凤凰快三

北京市政协委员建言历史文化名城保护 :注重赓续“京味文化”******

  中新网北京1月18日电 (记者 杜燕)作为首批国家历史文化名城,40年间,北京努力探索历史文化名城保护。北京市政协十四届一次会议上,委员们围绕赓续“京味文化”、守护精神家园建言北京历史文化名城保护。

  来自教育界别的北京市政协委员、中国戏曲学院院长尹晓东谈到,目前,中轴线申遗进入最后冲刺阶段,2023年2月将正式提交申遗文本。申遗的过程,应该成为向世界讲好中国故事、传播好中国声音的过程。而以昆曲、京剧为代表的非物质文化遗产,没有得到充分的挖掘和很好的彰显。

  他建议,在北京中轴线申遗过程中阐发更多的非物质文化遗产元素,讲述由线到面的建筑群和城市生活空间与文化传承发展的故事,讲述文化遗产与中国人精神文化生活之间的关系,讲述非物质文化对城市生活的滋养,以此突出昆曲、京剧两个人类非物质文化遗产诞生和传承发展与中轴线之间的独特关系。

  他认为,要通过中轴线申遗,讲好中国人对待民族优秀传统文化进行守正创新的文化追求,讲好对传统文化进行创造性转化、创新性发展的故事,传递好古今辉映、文明互鉴的声音。

  来自文艺界别的北京市政协委员、北京京剧院领衔主演杜镇杰认为,传承非遗文化守护精神家园从非遗传承保护的高度出发,更加全面地巩固和发展“京味文化”。京味文化不是片面单一的,它是一个内涵丰富、包罗万象的综合体,是由京剧、相声、鼓曲,胡同、美食、古迹等一个个具象概念组成。

  他还建议加大对非遗文化创意和文化科技创新工作的鼓励引导和政策支持。中国有着五千年悠久历史,目前对基于传统文化的核心创意及其与科技融合创新的支持还不够,还没有把文化科技人才、文化市场人才的积极性和创造力充分激发出来。因此,希望有关部门鼓励更多有识之士,尤其要鼓励青年人才从事传统非遗文化的研究与探索,努力使非遗文化融入百姓生活,给人们带来愉悦身心、寓教于乐的感受等方面贡献智慧、增添力量、创造价值。

  “我们生活在北京这座城市,人们动不动就讲‘老北京’,‘老北京’不是说它岁数大了、年头长了,而是指有文化积淀。”来自民盟界别的北京市政协委员、中华文学基金会副秘书长王勇强建议,在旧城改造中,应注重赓续京味传统文化。

  他关注到,许多腾退下来的文物建筑大都变成了小博物馆,发展比较受限。建议深入挖掘已经整治过的街巷、文物建筑历史,使历史传承与地域民俗文化、人文构思相结合,找出突破点,逐步调整,做好规划,使每一个文物建筑不但具有历史文化内涵,而且更加具备文物特性、个性和活力。

北京房山琉璃河西周燕都遗址出土文物。 北京市文物局供图北京房山琉璃河西周燕都遗址出土文物。 北京市文物局供图

  来自文艺界别的北京市政协委员、北京北京语言大学教授方铭谈到,北京保有全国最大规模的古典建筑群,建议对北京地区迄今为止发现最早的古城遗址——房山琉璃河西周燕都遗址进行适当复原,以体现北京作为华夏文明重要节点的意义。

  在他看来,历史文化名城建设绝不仅限于对有形遗迹的保护,还应包括对传统文化的保护和传承。孔子创立的儒家学说以及在此基础上发展起来的儒家思想,对中华文明产生了深刻影响,是中国传统文化的重要组成部分。建议北京在历史文化名城保护中,保护北京孔庙和国子监,加强市民的伦理文化建设,从小教育孩子们学会与人相处的礼节和言谈举止,培养仁义礼智信、温良恭俭让之德。

  《北京市“十四五”时期历史文化名城保护发展规划》指出,要统筹做好历史文化名城的保护利用传承,构建涵盖老城、中心城区、市域和京津冀的历史文化名城保护体系,实现市域保护全覆盖,应保尽保不漏项,推动优秀传统文化创造性转化、创新性发展。按照老城不能再拆的要求,以中轴线申遗保护为抓手推进老城整体保护与复兴,建设三山五园地区国家历史文化传承典范地区,统筹推进大运河文化带、长城文化带、西山永定河文化带建设,创新历史文化遗产保护利用,构建历史文化名城保护治理体系,精心保护好北京历史文化这张“金名片”,凸显北京历史文化整体价值。(完)

中国网客户端

国家重点新闻网站,9语种权威发布

凤凰快三地图