EpiK的知识图谱:认知智能+分布式存储背后隐藏的万亿蓝海

[复制链接]
5926 |0
发表于 2021-2-26 19:30:00 | 显示全部楼层 |阅读模式

我们正在经历互联网最为鼎盛的时期,然而这种空前繁荣并不能代表行业已经到达了顶点,数字货币、数字孪生体、数字经济、数字化转型,互联网未来的纵深度不断地扩大,而变化背后的最终目的是让科技创新的成果回归到人本身。


AI:智能化时代的关键角色

2020年“新基建”战略路线中,三大领域中有两块都是直接提及到了一项核心技术,那就是AI人工智能。信息基础设施领域,人工智能与云计算、区块链一起被视为一种新技术基础设施。而在融合基础设施领域中,人工智能则被视为支撑传统基础设施转型升级的重要工具,弥合技术创新与人自身发展的关键。


同时作为Web3.0构想中的重要集成。人工智能的技术价值体现在社会生产关系中的方方面面,譬如在新冠病毒防治中,AI技术可以帮助进行快速的筛选和准确的分类,将决策分析的结果传递给人,来完成下一步的动作,运用AI进行自动识别、非接触性机器辅助等,使防疫工作得以高效智能的自动化执行。


除此以外,教育、金融、制造等行业也越来越需要人工智能的介入,就AI自身能力来看,其可以替代人力节省成本,为企业或机构降本增效,且智能化流程操作不受主观因素影响,更显效率与公平。就时代发展大方向来看,物联网和智慧城市建设使得机器联网和场景应用变得多元复杂,这使得人工智能在不同圈层的创新技术关系链上处于至关重要的位置。


如何使得AI在服务覆盖上更有广度,服务内容上更具有深度,是下一步要重点推进的方向。这就需要高度发散性的产业技术融合,例如新基建七大领域中的5G、大数据工程,以及后期被重点引入的以区块链技为核心的分布式技术,这些都有可能也有必要与AI形成共生发展的联动关系。那么这种联动首先会发生在哪一点就需要首先理解AI发展的关键所在。


从弱人工智能向下突围

首先评判人工智能技术存在价值的关键在于,其应用层是否贴近产业和商业核心。一般来说人工智能分计算智能、感知智能和认知智能三个层次。计算智能即快速计算、记忆和储存的能力。感知智能即对自然界具象事物的识别与判断能力。认知智能则为理解、分析等能力。当前,数据标准化已经趋于成熟,计算智能已基本实现,在机器学习和深度学习技术的推动下,以视听觉等识别技术为目标的感知智能也实现了一定的突破。


但目前人工智能在感知和认知上还处在一个弱人工智能的状态,只能在某一方面协助或替代人类。当人们能使用机器识别更多事物,自然而然地引发了对事物的理解和分析等深层次的自动化知识服务的需求,而需要外部知识、逻辑推理或者领域迁移的认知智能领域还处于极为初级的阶段。


从感知智能到认知智能的过渡将是一个必然并且是现阶段人工智能产业发展重点的过程,这个过程要解决的核心问题在于如何让机器理解人类对于处理现实信息与实物之间关系的逻辑。其底层支撑就是知识图谱技术。


wk588_com_0sqt4ebeflu.jpg

wk588_com_0sqt4ebeflu.jpg 上图是一个极小的知识图谱,

目的在于让机器告诉灭霸,应该如何收集所有的无限宝石


知识图谱是一种用图模型来描述知识和建模世界万物之间关联关系的大规模语义网络,是大数据时代知识表达的重要方式之一。互联网之父蒂姆伯纳斯李曾经提出过一个设想:“网络中的所有计算机都可以分析网络中的数据,包括内容、链接以及人与计算机之间的通信。语义网会让这一切成为可能,日常的交易机制、事务和我们的日常生活都是通过机器对机器的通信来处理的。人们吹嘘多年的“智能代理”终将实现。”


简单理解就是,机器能够理解数据,并且解释数据进而解释现象,拥有推理、规划等一系列人类所独有的思考认知能力,而这些能力的实现与大规模、结构化、关联密度高的背景知识是密不可分的。


知识图谱越稠密,机器越智能。但其构建并非易事,因为机器本身是无意识的,从输入计算、认知感知、反应性意识到行为智能,整个成长历程都需要知识图谱的铺垫和喂养,在检验AI有效参与现有经济生产关系,粘合技术、人和创新的过程中,通过海量结构化和非结构化数据进行知识萃取并关联形成网状知识结构,富含实体、概念、属性和关系等信息的知识图谱,将是AI可以参与生产的基础锚点。


AI的火热并不能代表知识图谱这一底层技术的发展速度,目前该行业还存在以下几个问题:


  • 互联网巨头把持市场

知识图谱的构建仍旧局限在大型互联网公司之中,例如阿里巴巴要让淘宝内购物推荐更加智能化,百度发展人工智能去强化自家的地图和搜索业务,基于自家数据资源的知识图谱构建基本是“各玩各的,互为藩篱”,各机构间知识图谱无法互通互联,知识图谱的功用性单一不说,还造成了巨大的重复性浪费。


在以一个个互联网巨头为中心的模式下,构建知识图谱并不是一件很难的事情,难点在于如何构建更加通用普惠的知识图谱,这样的工程不是单一互联网巨头能够完成的,这其中会横跨不同的地域、种族、语言以及企业商业壁垒等等。所以现如今的知识图谱构建还存在一定局限性。


  • 资源分配并非市场化

这里面的资源分配一是受制于大型公司,二是知识图谱的构建工作难度大,需要巨大的人力、物力、财力,一定程度上限制了自由市场与技术进步提高资源配置效率的作用发挥,如此发展,知识图谱的应用就无法实现从公司到大众的价值传输,也就无法迸发更大价值,欠缺成长动力。


  • 模仿复制缺乏新意

由于AI的时代刚需性,知识图谱的市场潜力自然是非常大的。很多人急于分羹这波红利,于是匆匆而入,但构建知识图谱逻辑就是照搬照抄,或者仅从小的细分垂直领域切入,创新性不足,这直接拉低了整个市场的发展水准,知识图谱建设可谓路途漫漫。


Web3构想下知识图谱工程发展可能发生的新变化

 客观来讲,仅凭现有的商业模式和传统思维是无法构建理想化的知识图谱的,最多就是一种应时而需的开发战术,远无法满足Web3.0时代的机器智能的时代诉求。想要脱离现有的困局,构建更加多样化、稠密以及更具通用性的知识图谱。需要一种更加开放的体系,调用更大范围的人、物力等资源,但难点就在于如何协调这些资源的关系,同时形成有序协作。中心化机构以及模式领导下,知识图谱构建会涉及到诸多问题,例如采集知识数据时与用户数据和隐私主权的冲突、产业协作过程中利益分配的冲突以及约束中心化机构作恶行为的治理冲突,这些问题和冲突始终在制约着行业进入更大更快的轨道。


Web3.0中以区块链等技术为核心的去中心化、分布式解决方案已经对人类社会资源、组织协作产生新的影响,就像刚刚于去年上线主网的分布式存储FIL解决了存储资源的规模性协作以及市场机制问题。Web 3.0对于大规模有序且自动化的协作生产的优势,让很多产业拥有了全新的发展思路。


现实案例:基于分布式体系下的大规模知识图谱构建协作平台

而在知识图谱构建上,我们发现一家名为EpiK Protocol项目已经开始探索AI和区块链行业结合的可行路径。据项目官方白皮书资料,EpiK的目标是构建完全去中心化的共建共享共益的安全可信的人类知识图谱协作平台,赋能认知智能新基建。它就像一个知识图谱的系统集成平台,通过区块链分布式网络连接着大规模知识图谱上游制造者和下游的人工智能应用带,从而打通上下游的产业活力。虽然项目还处于早期阶段,但透过体现项目建设路径的白皮书内容上,EpiK知识图谱协作平台已经有了清晰的发展规划。


具体来说,EpiK仍然秉承Web3.0总体路线中的区块链技术集成,借助区块链技术的可信、分布式、不可篡改等诸多特性展开,通过将分布式存储技术、DAO以及人工智能应用进行系统性的整合,用分布式解决方案靶向解决AI产业发展痛点,打造一个让机器理解人类知识和需求的语义网络环境。


虽然EpiK的建设路径遵循公链项目主节奏,但区别于市面上已有的分布式存储应用,EpiK是一个更加复合性的商业规划,因此我们在理解EpiK以及这个应用的前景时已经不能单纯地从分布式存储技术解决方案这个角度去看待,EpiK梳理出的完备且巧妙借力的发展策略,具体我们可以从EpiK提出的可信存储、可信激励、可信治理、可信金融四个核心能力上去理解。


首先借助分布式存储散布在全球的节点,EpiK可以在最大范围和最大多样性的条件下,收集各种人类知识信息,并且在分布式存储网络中安全永久地保存。分布式存储的优势主要体现在以下几个方面:


一、 EpiK 生态中负责分布式存储的知识矿工,能够高效地管理读缓存和写缓存两种数据读写方式。EpiK 数据存储层同时支持自动的分级存储,通过将热点数据映射到高速存储来提高系统响应速度——这意味着当 EpiK 知识生态在领域专家的监督下构建新兴领域的知识图谱时,将频繁调用该领域的相关知识,例如三元组的实体关系网络,因此需要高密度地访问存储节点以获取这方面知识。一旦这些数据不再被频繁使用,则将其移出高速存储。分布式存储的高性能特性,能够让热点数据以高效率调取,使得在构建 EpiK 知识图谱的过程中,精准调用网络资源。


二、 分布式存储具有多副本的一致性。传统的存储架构,如 SAN、NAS 通过 RAID 模式保证数据的可靠性,而分布式存储则采用了多副本备份机制。赏金猎人依据领域专家所分配的任务,上传规定数据后,知识矿工将及时响应并将数据进行分片后上传。为了保证分片数据副本之间的一致性,分布式存储采用的是一个副本写入多个副本读取的强一致性技术,以满足多租户的不同可靠性需求。这一架构完美避免了“数据孤岛”的弊端,多方可共享共读共写内容一致的知识图谱数据,而不会产生数据一致性欠缺和信息更新同步差的问题,如此方能建设共建共享共益的知识图谱协作平台。


三、 分布式存储具有弹性扩展的特性。当知识图谱中的某一部分数据被频繁使用后,存储该数据的节点将面临负载过重,甚至单点过热的情况。EpiK在知识矿工端的知识节点数据可自动迁移到新节点实现负载均衡,同时新节点只需和原有集群连接至同一网络,便不会对知识图谱数据产生影响。


其次,在共识算法加持的DAO组织效应下,EpiK能够有效调动远超于一般中心化机构可调动的资源,开放让生态各角色参与投票,基于利益绑定越深,投票权越大的目标,可以让这些资源基于在同一个目标下形成自动化的有序协作和管理。去中心化自治组织(DAO)既是一种新型的组织形态,更是一种令人耳目一新的协作方式。EpiK 铭识协议从根基来说,是基于用户的,由使用者参与构建,生态内所有角色共建共享的知识生态。核心突出“共”的思想,这与 DAO架构的思维方式不谋而合。过去,自由民主的社会管理制度将权力归属于人民,“Of the people, by the people, for the people”的口号言犹在耳。然而,互联网的现状已趋向腐化,数据滥用、巨头垄断等现象激发了向往公平正义的人们推动 Web3 的前进。在 DAO 架构中,通过鼓励用户参与社区协调建设,既增进了用户对社区的归属感,也促进了良性的组织管理闭环。作为知识图谱研究者、使用者的人们通过获得投票权,可以决定负责专有领域知识图谱质量的领域专家的去留。领域专家作为专家群体,只占社区人数的少数,对应其所获得的奖励,知识生态对于领域专家的要求也不言而喻——为平台贡献优质有效的知识图谱数据,是领域专家不可推辞的职责。而在知识生态中,这并不意味着领域专家因此而高人一等,其他通过贡献而获得收益的角色,如知识矿工、赏金猎人、知识网关,都有在社区做决策的权力,每个个体的发言,都能被社区听到。这不像是传统的数据采集机构,仅将数据整合作为服务的过程,人们就像买一杯咖啡一样,交钱离开。在EpiK知识图谱协作平台中,没有纯粹的用户,每个购买者都是构建者,人们手中的“货币”不仅可以换取服务,还是一张珍贵的选票,象征着社区权益。


再次借助博弈论和通证体制下的激励设计,EpiK可以让每一个单位保持最高的积极性,从而为EpiK的知识图谱构建提供源源不断的自驱力,共同推动整个生态的繁荣。通过智能合约,而不是组织的章程制度,将社区的人们组织在一起。人们可以在世界的任一角落,在不同的行业、圈子中,共同搭建 EpiK 大规模的人类知识图谱。古时有巴别塔,而今地域文化已不是沟通的障碍,却是繁琐而复杂的企业协作流程提高了协作成本,真正阻碍了人们协作的热情。通过分布式总账技术,以“代码为王”,社区日常运营都由智能合约自动化、流程化,真正实现“去中心化”和“自治”,社区治理无法被某一个体掌控。在 EpiK 知识生态中,EpiK 通证具有”工作代币“的属性,领域专家、赏金猎人与知识矿工通过向知识图谱协作平台共享相应的工作而获得通证。同时,EpiK 通证是“基于受BTC启发的底层技术的稀缺数字资产“,通证因稀有性而具备价值。作为技术的新模型,EpiK 通证可以替代以权益为基础的传统股权融资形式,用户在 EpiK 价值交换层获取通证并不会稀释资本,反而会大幅增加买方基础并提供流动性。通过 EpiK 通证经济的实现,将保证业务向全球用户无差别开放,保证了去中心化协作公平公正的基石。


尤其是能力之一的可信金融可以看作是EpiK非常大的创新,其集成 Ethereum 的 EVM 虚拟机,并引入了资产跨链网关、Chainlink预言机和借贷等典型去中心化金融应用,为了知识图谱生态参与者提供灵活的资产配置服务。去中心化金融(DeFi)提出了全新的金融体系,通过开源的智能合约,就能够构造出各色各样、丰富多彩的金融应用的“金融原语“。EpiK可信金融这一能力,赋予用户充当自我资产保管人的权力,EpiK 生态参与者们可以完全控制个人资产,并拥有完全所有权和对所有非中介的市场平台的许可访问权。在 EpiK 知识生态中,引入 EVM 等 DeFi 应用,是为了让用户能更自由地进行跨链交易,不受限制地进出不同的链上生态。通过资产跨链资产跨链网关将独立于各链的资产进行集中组合,以更高透明度、更高效率和更低的成本与周转时间,为 EpiK 用户提供跨平台、跨交易场所的资产转移能力,满足多样化的金融需求,由此更好地服务于知识生态。这意味着,价格效率将大幅提高,作为 web3 生态的参与者,EpiK 通过开放分散跨链借贷系统鼓励用户灵活分配资产,根据不同需求独立考虑资产风险。此外,与传统金融行业的最大区别在于去中心化金融的创新型。任何人都可以通过智能合约堆积”DeFi乐高“,自由设计出符合独特需求的金融产品,这大大提高了开放金融领域的流动性和活力,也为 EpiK 知识生态提供了无限可能性。


四个核心能力,可信存储引入FIL生态资源、可信激励主张贡献越大激励越高、可信治理用分布式自治组织发展、可信金融则融合了市场前沿DeFi机会,所以说,抢占市场蓝海并前瞻布局的EpiK项目整体能力突出。



wk588_com_wnvoftdqxvf.jpg

wk588_com_wnvoftdqxvf.jpg 在知识生态建设上,EpiK主要有领域专家、赏金猎人、知识矿工、知识网关这四个核心参与者。领域专家组织生产各个类目的人类知识库数据并上传数据给矿工;赏金猎人完成领域专家拆解和发布的各个知识抽取的子任务,并由领域专家验收;知识矿工参与领域专家选拔投票,维护生态良性发展;知识网关为外部提供人类知识库访问服务,索引人类知识库,有组织的滋养AI应用生态;各参与方为了自身利益最大化而持续丰富人类知识库,即可持续不断的获得EpiK代币奖励。


我们可以拿2020年新冠疫情中大热的在线教育来对EpiK的商业闭环进行一个完整的还原。外界公开的或者经过有效授权的信息数据,经过行业专家和赏金猎人进行精细化的处理后转化为有组织有价值的数据,并存入分布式存储网络中进行流转,企业通过数据网关按需获得这些数据,同时也可以将自身经过有效授权的数据对来源端进行反哺,进行数据的二次变现。这个例子只是EpiK商业场景中的冰山一角,像工业互联网、城市治理、智慧建筑业等都是EpiK规划的价值增长点,由于是商业化的基础型设施,所以EpiK的场景是拥有极大想象空间的。


wk588_com_utauv1q20hg.jpg

wk588_com_utauv1q20hg.jpg EpiK原生通证EPK总量为设定为10亿,其中7亿是完全分配给EpiK的商业生态系统,用于矿工激励、行业专家以及投票用户,同时也可以用于DAO的治理,从通证方案的设计上可以看出EpiK非常重视整体生态的治理发展。为了达成生态的长期发展目标,项目创新性的采用了浮动+固定+抵押的通证经济模型设计,连通知识供给、知识图谱存储和知识网关的三方实现角色各方博弈制衡,保证项目盈利的持续性。又由于EPK是贯穿整个商业闭环始终的关键性通证,知识图谱构建工作、分布式存储网络的建设和维持、数据的流转、企业应用采购等等环节都需要用到EPK,也就是说除了必要的共识支撑外,EpiK的通证拥有着完整商业价值支撑。


总结下来,EpiK整个经济模型设计即客观让大家在谋求自身利益的同时,能形成合力去实现项目价值。据悉,该项目原生代币EPK即将上线交易所,从事知识图谱工作的专家学者、企业团队及矿工生态对此十分关注,大多表达出参与其中的迫切性,作为将分布式存储引向下半场的潜力股,可能是分布式存储和人工智能板块新的增长点。


放眼于整个人工智能热潮去看,知识图谱市场是一个万亿级别的大蛋糕,因为知识图谱构建是智能化时代的基础性工程,随着人工智能和5G、物联网这些技术不断地发展壮大,市场对于优质知识图谱资源的需求就会越来越强烈,将作为推动人类进入全面AI未来的一个关键工程。EpiK项目让这个工程通过分布式存储赛道切入,可以为更多的AI应用场景提供规模化、可信化的知识图谱库,为分布式存储赛道、知识图谱和AI进入主流价值视野提供一个巨大的机会,在AI的未来场景需求中和新技术产业发展中找到了知识图谱协作平台的商业定位,至于未来发展,我们保持期待,毕竟AI大蓝海的未来非常光明,而像诸如此类项目的Web3.0构想可能还会不断地改造现有的组织形态和商业逻辑,为规模化协作产业和分布式存储板块提供榜样示范。

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

热门版块
快速回复 返回顶部 返回列表