随着互联网和大数据应用的蓬勃发展,JSON格式被广泛应用在不同系统、Web服务器和浏览器之间处理数据交互。不过,饱受恶评的前任技术XML仍有用武之地。 举例来说,虽然JSON(javascript对象表示法的简称)已经成为一种重要的数据格式,应用于心理学专业协会、教育者和学生。但IT架构师及语义数据资深人士Beverly Jamison认为,XML(扩展标记语言)在专门的数据集成需求方面仍然扮演着重要角色。
曾在美国心理协会(APA)担任IT架构和出版解决方案的高级总监Jamison说:“XML在学术出版界数据交换方面应用很广。很多b2b交互仍然在大量使用XML。”她在2015年底离开了这家位……
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号

TechTarget
官方微博

TechTarget中国
随着互联网和大数据应用的蓬勃发展,JSON格式被广泛应用在不同系统、Web服务器和浏览器之间处理数据交互。不过,饱受恶评的前任技术XML仍有用武之地。
举例来说,虽然JSON(javascript对象表示法的简称)已经成为一种重要的数据格式,应用于心理学专业协会、教育者和学生。但IT架构师及语义数据资深人士Beverly Jamison认为,XML(扩展标记语言)在专门的数据集成需求方面仍然扮演着重要角色。
曾在美国心理协会(APA)担任IT架构和出版解决方案的高级总监Jamison说:“XML在学术出版界数据交换方面应用很广。很多b2b交互仍然在大量使用XML。”她在2015年底离开了这家位于华盛顿的机构,成为了一名独立IT咨询顾问。
在接受采访时她还在APA,Jamison说,过去这几年,JSON帮助专业协会为大约八万会员在网络上更快速地传递信息。
Jamison负责管理学术出版系统的改进,该系统目前管理16万期刊文章和三百万摘要信息,包括一些参考文献可以追溯到100多年前。她说:“我们学术文章的外部引用信息往往用JSON格式表示。”
不同数据格式引发的碰撞
JSON格式支持开发者保持相当程度的设计独立,对数据的描述非常简单,前期结构约束限定做到了最小化。JSON走向了前沿,成为XML的替代品。尽管如此,一些学术文档还是从XML的标记功能中受益,因为XML更加结构化,文档元素数据定义更严格。正因为如此,XML很自然地成为APA需要的交互机制。
此外,在APA环境中这两种数据格式并不是相互排斥的。某些情况下,JSON用于传输嵌套的XML载荷。用Jamison的话说,就是:“对另一端的要求不是那么苛刻,假定他们仍然在使用XML文档。”
Jamison和她的团队开发的API支持出版系统以JSON或者XML两种格式发起请求,根据特殊需要使用即可。
她说:“我们最喜欢内容系统中的XML和JavaScript,简直是两全其美。内容只作为结构存在一次,但它可以表现为XML或者Java。”
软件供应商MarkLogic公司设计的同名数据库(MarkLogic数据库)充当APA出版系统的开发和运行平台。2008年开始就在用了,那时候协会正把早期的数据
MarkLogic公司的软件最早是在十多年前开发的,定位是管理XML文档的数据库。但是,为了满足新数据架构的需求,MarkLogic已添加的功能超出了XML支持,现在归类为NoSQL数据库。在2014年该公司发布的MarkLogic 8支持原生JSON功能。
Joe Pasqua是MarkLogic公司产品战略副总裁,他说JSON和XML这两种格式在程序员中应用都很广,只是用于不同的场合。JSON经常用于Web API,擅长表示编程对象;在他看来,JSON并不像XML那样可以更好地展示标记文档。
用于语义的数据三元组
2015年八月,MarkLogic公司在发布的第8版产品中增强了对语义数据的处理。这样一来,现在该数据库可以与Apache Jena和Eclipse Sesame语义API协作了。Jena和Sesame都是为帮助开发人员使用资源描述框架(RDF)而设计的,这种框架是图形风格的数据结构,采用三元组的存储格式,更好地表达不同数据元素之间的关系。
三元组描述数据关系使用主语、谓词和宾语的结构。有很多独立的RDF数据库,图形数据库技术的变体专为存储三元组开发出来。但是MarkLogic公司在数据库产品中提供了对三元组存储的原生支持。该技术加上SPARQL语义查询语言技术,都很好地支持了APA团队使用MarkLogic的软件环境创建和管理数据图。
Jamison说:“APA的元数据研究其实就是对关系的研究。三元组存储大体是捕
展望未来,APA可能会继续利用各种各样的数据格式,包括JSON格式、XML、RDF以及其它格式。Jamison说,对于整个APA来说,“最重要的事是建立高度模块化的数据流管道。”
翻译
TechTarget特邀编辑。2003年入软件行业,熟悉软件过程所有环节,对机构信息化的各方面有深入理解和实践经验。现就职于某互联网创业公司,目前关注互联网分布式系统架构和机器学习。喜欢传统文化社科哲学(尤喜《周易》、《老子》),喜健身喜抓举(具备抱人引体向上的能力),喜欢中国象棋(具备盲棋1对2的能力)。
相关推荐
-
Spark尚未“成熟” 用户仍需“专业”
虽然Spark的应用对企业而言已经并不陌生,但对于一些企业来说,这项技术可能还是比较“前沿”。
-
关于如何选择混合云,你不得不知的几件事
近年来,提升云计算能力一直是IT决策者和企业对于未来规划的着重点,随着云计算的不断发展,混合云渐渐成为关键词。
-
【对话Teradata高管】我们很幸运,这是一个“大I小T”的时代
Teradata天睿公司近日在上海举办的“2017 Teradata大数据峰会”上,Teradata天睿公司高管们分享了Teradata在开源技术方面的观点和举措。
-
Tableau 携手神州数码 推进中国商业分析发展进程
为了帮助商业领域的更多从业者使用数据,在更短的时间内做出更好的决策,可视化分析领域的Tableau Software今天宣布与神州数码集团建立合作伙伴关系,在中国的商业分析进程中展开深度合作。