Установите конечную точку SPARQL для использования с пользовательскими онтологиями и тройными RDF.

Я пытался понять, как смонтировать конечную точку SPARQL в течение нескольких дней, но сколько я ни читал, я не могу этого понять.

Прокомментируйте мое намерение: у меня есть открытый сервер данных, установленный на CKAN, и моя цель — иметь возможность использовать запросы SPARQL к данным. Я знаю, что не мог бы сделать это непосредственно с самими наборами данных, и мне пришлось бы определить свой собственный OWL и преобразовать данные, которые я хочу использовать, из формата CSV (который является форматом, в котором они в настоящее время) в тройной формат RDF (чтобы быть используются как связанные данные).

Идея состояла в том, чтобы сначала протестировать метаданные репозиториев, которые могут быть сгенерированы автоматически с расширением ckanext-dcat, но это то, что я действительно не нахожу, с чего начать. Я искал информацию о том, как установить сервер Virtuoso для SPARQL, но информация, которую я нашел, оставляет желать лучшего, не говоря уже о том, что я нигде не могу объяснить, как я мог бы на самом деле внедрить свои собственные OWL и RDF в самом Virtuoso.

Кто-то, кто может протянуть мне руку, чтобы знать, как начать? Спасибо

21.05.2017

1. Вам потребуется сопоставление RDB2RDF, т. е. вам необходимо сопоставить таблицы/столбцы с классами/свойствами и т. д. в онтологии, которую вы должны создать в первую очередь. Затем вы можете использовать такой инструмент, как Ontop, для преобразования данных или использовать сопоставление R2RML, которое преобразует запросы SPARQL в запросы SQL, т. е. вам не нужно сначала преобразовывать данные. Тем не менее, вы должны написать сопоставление R2RML 21.05.2017

Ответы:

Я немного запутался. Может быть, это два или более вопросов?

1. Как преобразовать табличные данные, такие как CSV, в семантический формат RDF?

Это можно сделать с помощью подхода R2RML. Karma — отличный графический интерфейс для этой цели. Как вы сказали, такое преобразование действительно можно улучшить с помощью лежащей в его основе OWL-онтологии. Но это можно сделать и без создания пользовательской онтологии.

Я подробно остановился на этом в ответе на другой вопрос.

2. Теперь, когда у меня есть данные в формате RDF, как я могу предоставить их с помощью конечной точки SPARQL?

Виртуоз - разумный выбор. Существует несколько способов его развертывания и несколько способов загрузки данных, и, следовательно, МНОГО руководств по этому вопросу. Вот один хороший пример из DBpedia.

Если вам нужен более простой способ запуска тройного хранилища RDF с конечной точкой SPARQL, Stardog и Blazegraph доступны в виде файлов JAR, а < href="http://docs.rdf4j.org/server-workbench-console/" rel="nofollow noreferrer">RDF4J можно легко развернуть в контейнере, таком как Tomcat.

Все они предоставляют графические веб-интерфейсы для загрузки данных и выполнения запросов в дополнение к конечным точкам SPARQL REST. По крайней мере, Stardog также предоставляет инструменты командной строки для массовой загрузки.

21.05.2017

Спасибо! Думаю, у меня было несколько концепций в голове, но скорее перемешанных друг с другом. Большое спасибо за то, что пролили свет на тему! 24.05.2017

Не за что. Задайте больше вопросов, если вам нужно. 24.05.2017

Новые материалы

Кластеризация: более глубокий взгляд

Кластеризация — это метод обучения без учителя, в котором мы пытаемся найти группы в наборе данных на основе некоторых известных или неизвестных свойств, которые могут существовать. Независимо от..

Как написать эффективное резюме

Предложения по дизайну и макету, чтобы представить себя профессионально Вам не позвонили на собеседование после того, как вы несколько раз подали заявку на работу своей мечты? У вас может..

Частный метод Python: улучшение инкапсуляции и безопасности

Введение Python — универсальный и мощный язык программирования, известный своей простотой и удобством использования. Одной из ключевых особенностей, отличающих Python от других языков, является..

Как я автоматизирую тестирование с помощью Jest

Шутка для победы, когда дело касается автоматизации тестирования Одной очень важной частью разработки программного обеспечения является автоматизация тестирования, поскольку она создает..

Работа с векторными символическими архитектурами, часть 4 (искусственный интеллект)

Hyperseed: неконтролируемое обучение с векторными символическими архитектурами (arXiv) Автор: Евгений Осипов , Сачин Кахавала , Диланта Хапутантри , Тимал Кемпития , Дасвин Де Сильва ,..

Понимание расстояния Вассерштейна: мощная метрика в машинном обучении

В обширной области машинного обучения часто возникает необходимость сравнивать и измерять различия между распределениями вероятностей. Традиционные метрики расстояния, такие как евклидово..

Обеспечение масштабируемости LLM: облачный анализ с помощью AWS Fargate и Copilot

В динамичной области искусственного интеллекта все большее распространение получают модели больших языков (LLM). Они жизненно важны для различных приложений, таких как интеллектуальные..

Machine Learning JavaScript Blockchain Artificial Intelligence Data Science Cryptocurrency Software Development Python Web Development Coding Deep Learning AI Bitcoin React Software Engineering Ethereum Web3 Business Crypto Nodejs Solidity Development Front End Development Data Finance Money Java Trading Typescript Smart Contracts Productivity Tech Startup Investing Neural Networks Developer Computer Science NLP