Nano Hash - криптовалюты, майнинг, программирование

Установите конечную точку SPARQL для использования с пользовательскими онтологиями и тройными RDF.

Я пытался понять, как смонтировать конечную точку SPARQL в течение нескольких дней, но сколько я ни читал, я не могу этого понять.

Прокомментируйте мое намерение: у меня есть открытый сервер данных, установленный на CKAN, и моя цель — иметь возможность использовать запросы SPARQL к данным. Я знаю, что не мог бы сделать это непосредственно с самими наборами данных, и мне пришлось бы определить свой собственный OWL и преобразовать данные, которые я хочу использовать, из формата CSV (который является форматом, в котором они в настоящее время) в тройной формат RDF (чтобы быть используются как связанные данные).

Идея состояла в том, чтобы сначала протестировать метаданные репозиториев, которые могут быть сгенерированы автоматически с расширением ckanext-dcat, но это то, что я действительно не нахожу, с чего начать. Я искал информацию о том, как установить сервер Virtuoso для SPARQL, но информация, которую я нашел, оставляет желать лучшего, не говоря уже о том, что я нигде не могу объяснить, как я мог бы на самом деле внедрить свои собственные OWL и RDF в самом Virtuoso.

Кто-то, кто может протянуть мне руку, чтобы знать, как начать? Спасибо


  • 1. Вам потребуется сопоставление RDB2RDF, т. е. вам необходимо сопоставить таблицы/столбцы с классами/свойствами и т. д. в онтологии, которую вы должны создать в первую очередь. Затем вы можете использовать такой инструмент, как Ontop, для преобразования данных или использовать сопоставление R2RML, которое преобразует запросы SPARQL в запросы SQL, т. е. вам не нужно сначала преобразовывать данные. Тем не менее, вы должны написать сопоставление R2RML 21.05.2017

Ответы:


1

Я немного запутался. Может быть, это два или более вопросов?

1. Как преобразовать табличные данные, такие как CSV, в семантический формат RDF?

Это можно сделать с помощью подхода R2RML. Karma — отличный графический интерфейс для этой цели. Как вы сказали, такое преобразование действительно можно улучшить с помощью лежащей в его основе OWL-онтологии. Но это можно сделать и без создания пользовательской онтологии.

Я подробно остановился на этом в ответе на другой вопрос.

2. Теперь, когда у меня есть данные в формате RDF, как я могу предоставить их с помощью конечной точки SPARQL?

Виртуоз - разумный выбор. Существует несколько способов его развертывания и несколько способов загрузки данных, и, следовательно, МНОГО руководств по этому вопросу. Вот один хороший пример из DBpedia.

Если вам нужен более простой способ запуска тройного хранилища RDF с конечной точкой SPARQL, Stardog и Blazegraph доступны в виде файлов JAR, а < href="http://docs.rdf4j.org/server-workbench-console/" rel="nofollow noreferrer">RDF4J можно легко развернуть в контейнере, таком как Tomcat.

Все они предоставляют графические веб-интерфейсы для загрузки данных и выполнения запросов в дополнение к конечным точкам SPARQL REST. По крайней мере, Stardog также предоставляет инструменты командной строки для массовой загрузки.

21.05.2017
  • Спасибо! Думаю, у меня было несколько концепций в голове, но скорее перемешанных друг с другом. Большое спасибо за то, что пролили свет на тему! 24.05.2017
  • Не за что. Задайте больше вопросов, если вам нужно. 24.05.2017
  • Новые материалы

    Кластеризация: более глубокий взгляд
    Кластеризация — это метод обучения без учителя, в котором мы пытаемся найти группы в наборе данных на основе некоторых известных или неизвестных свойств, которые могут существовать. Независимо от..

    Как написать эффективное резюме
    Предложения по дизайну и макету, чтобы представить себя профессионально Вам не позвонили на собеседование после того, как вы несколько раз подали заявку на работу своей мечты? У вас может..

    Частный метод Python: улучшение инкапсуляции и безопасности
    Введение Python — универсальный и мощный язык программирования, известный своей простотой и удобством использования. Одной из ключевых особенностей, отличающих Python от других языков, является..

    Как я автоматизирую тестирование с помощью Jest
    Шутка для победы, когда дело касается автоматизации тестирования Одной очень важной частью разработки программного обеспечения является автоматизация тестирования, поскольку она создает..

    Работа с векторными символическими архитектурами, часть 4 (искусственный интеллект)
    Hyperseed: неконтролируемое обучение с векторными символическими архитектурами (arXiv) Автор: Евгений Осипов , Сачин Кахавала , Диланта Хапутантри , Тимал Кемпития , Дасвин Де Сильва ,..

    Понимание расстояния Вассерштейна: мощная метрика в машинном обучении
    В обширной области машинного обучения часто возникает необходимость сравнивать и измерять различия между распределениями вероятностей. Традиционные метрики расстояния, такие как евклидово..

    Обеспечение масштабируемости LLM: облачный анализ с помощью AWS Fargate и Copilot
    В динамичной области искусственного интеллекта все большее распространение получают модели больших языков (LLM). Они жизненно важны для различных приложений, таких как интеллектуальные..