Компьютеры — это фантастические вещи, потому что они позволяют вам использовать гораздо больше доказательств при принятии решений, чем в противном случае. Можно писать компьютерные программы, которые автоматизируют проглатывание и анализ невообразимо больших количеств данных.
Если данные хорошо выбраны, она почти всегда в том случае, если вычислительный анализ открывает новые и удивительные идеи просто потому, что он включает в себя больше доказательств, чем может быть захвачен человеческим мозгом.
И потому, что вселенная хаотична, и есть комбинаторные взрывы возможностей повсюду, доказательства всегда лучше, чем интуиция при поиске понимания.
Как никто, кто боролся с компьютерами и большими количествами данных, не так просто, как это. Радость анализа и понимания часто разбивается под гору утомительных источников, подготовки, подготовки, управления и уборки — уродливые сценарии ETL, которые являются ужасом для поддержания и двойного ужаса пытаться извлечь данные с неизвестными кодировками символов из некументированных устаревших систем. — CP-1252 и его друзья.
Это не должно быть так; Это не должно быть таким. Компьютеры должны быть в состоянии сделать большую часть этого для нас. Нет смысла, чтобы мы по-прежнему пишете те же простые и утомительные программы проверки и преобразования данных и преобразования и над AD Infinitum. Там должен быть лучший способ.
Это проблема, которую мы отправились для решения с TerminusDB. Мы определили две абсолютно незаменимые характеристики, которые в настоящее время в настоящее время не хватало в инструменты управления данными.
Первый был богатым и универсально интерпретативным языком машиностроения. Если мы хотим, чтобы компьютеры могли автоматически преобразовывать данные между различными представлениями, они должны иметь возможность описать их модели данных друг к другу.
Вторым крупным недостающим требованием является эффективным контролем ревизии. Технологии управления ревизионным управлением были важны в том, чтобы превратить производство программного обеспечения от ремесла на инженерную дисциплину, поскольку они делают сотрудничество и координацию между большими группами гораздо большей неисправностей — и мальчики людей производят неисправности. Необходимость таких возможностей является кричательно очевидной при работе с данными — где существование нескольких версий одного и того же базового набора данных практически повсеместна и только с самой примитивной поддержкой инструментов.
В октябре 2019 года мы выпустили версию 1.0 TERMINUSDB — она содержала кульминацию 4 года построения потенциала моделирования данных, которые нам нужны — W3CS Web Ontology язык с закрытой мировой интерпретацией.
Мы выбрали это решение в первую очередь, потому что Сова, безусловно, лучшее, что человечество еще не производилось с точки зрения богатых, интерпретативных машиностроительных данных формата разряда данных. Это, по сути, логика первого порядка с установленными операциями — когда речь идет о взаимодействии платформы, ничего не изменит математику! И добавление закрытой мировой интерпретации на сову оказывается удивительно легким, а семантически необработанные (закрытые миры содержатся в открытых мирах).
В январе 2020 года с версией 1.1. Мы выпустили первую версию нашего хранения хранения нашего неизменного контроля пересмотра — со многими из идей, бесстыдно заимствованные из GIT, но значительно расширены, потому что при работе с данными необходимо различать такие вещи, как данные схемы и экземпляра и сохраняют их выравнивания. Оказывается, требует значительно более сложной структуры внутренних указателей, но это можно сделать!
В июне 2020 года мы выпустим версию 2.0 — это включало API контроля ревизии — push, Pull, ветвь и слияние полностью интегрировано с базой данных, запросом и модельным двигателем. На этом этапе сама база данных была более или менее полной с точки зрения особенностей, но была еще одна критическая и важная точка, прежде чем мы могли бы сказать, что нам удалось доставить на наше видение.
С распределенными технологиями совместной работы всегда есть проблема нагрузки — это бесполезно, имеющее технологию, которая позволяет сотрудничать с данными в одноранговый децентрализованный путь, если нет других людей, чтобы подключиться и сотрудничать с. Чтобы преодолеть эту проблему, нам нужно было доставить инфраструктуру, которая позволила бы людям начать работу, делиться и найти данные и сотрудники.
Сегодня мы выпустим Terminusdb версии 3.0 и в то же время мы открываем двери Terminushub Отказ База данных теперь полностью интегрирована с концентратором, что позволяет всем пользователям TerminusDB поделиться, хранить, публиковать и сотрудничать в базах данных с другими пользователями и делать это на Грантельскую цену бесплатно. С этим выпуском, я думаю, мы можем сказать, что у нас есть продукт, который доставляет на наше видение.
Сам продукт — это только средство для достижения цели. Мы построили Terminusdb, чтобы забрать боль от удивительных оснований на вычислительный анализ. Хотя мы не будем бесполезно продолжать сосредоточиться на продукте и удалить каждую точку боли, которое появляется, у нас теперь есть тип инструмента, который мы хотели. Теперь мы собираемся построить несколько действительно замечательных ресурсов данных.
Давайте построим здания!
Оригинал: «https://dev.to/lukefeeney/distributed-revision-control-for-structured-data-1h3n»