在本系列的“Part 2”中,我们讨论了Digital Thread的抽象模型和分析工具,本文“Part 3”我们将详细探讨Digital Thread的模型。
杰为使用图展示、表达、存储数字主线的数据模型。图实质上是顶点和边的集合,每一个顶点和边都具有类型、名称和属性描述,同时可以为边指定一个方向,在我们的解决方案中使用图库的特性解决Digital Thread数据架构问题,如图1,您会发现为什么Graph DB非常适合杰为的数字主线;同时图形数据库的第二个优点是它的技术是高度可扩展的,其OLAP服务,即查询、分析所需的时间与数据集的大小无关。特别是在Facebook和LinkedIn等社交网络的推动下,它们被设计成可以处理数万亿个节点和连接。
图1:Graph characteristics
在我们的数据模型中,存储库、上下文和元素都是顶点,关系是边。如图2所示:还有两种特殊类型的顶点。一个是“Inter Relation”和“Inter Connection”表示领域间模型语义和数据语义,元素和关系属于容器。例如,JIRA中包含多个项目容器,每个项目容器中记录了多个问题。第二个是“Type”关系, Repository和Repository Type之间关系,以及每个元素都有一个类型或基于元素进行新类型的扩展。
图2:JWI Digital Thread通用模型
从语义模型上看,杰为的数字主线如图3所示。每个大圆代表一个存储库。其中较小的圆圈是容器,其中包含元素和模型内关系。您可以在杰为的Digital Thread上通过语义建模工具为它们之间创建了一组模型间语义关系,这些关系被收集、索引在Digital Thread存储库中。注意,杰为Digital Thread并不试图存储源系统数据,只是存储它们之间的连接和索引,并使用足够的信息来标识和探索领域内和领域间的血缘关系。
图3:存储库、上下文、元素和关系映射
实际上,将每个存储库结构对应的语义模型映射到公共数据模型并不简单。每个专用工具都有自己的一组标准和自定义模型。CAD领域的映射不同于产品设计数据领域,如图4所示,其中仓库、容器和元素使用了不同的术语。有些工具与公共模型有很大的不同,关系可以被视为属性,映射是复杂的。
图4:领域模型映射与探索
在第4部分(即将发布)中,我们将进行一些数据科学研究了。我们将在Open Cypher图查询时应用这些概念,以分析涉对应上下文的数字主线的多个存储库。