Произвольные строки считаются приемлемыми в качестве ссылок в RDF N-Triples?

В документе W3C RDF 1.1 N-Triples производство IRIREF, используемое для небуквенных подлежащих/объектов/предикатов, определяется в значительной степени как просто строка в угловых скобках (‹>) [1], даже несмотря на то, что она называется IRI.

Не поэтому ли некоторые примеры файлов [2] имеют простые идентификаторы, в то время как другие синтаксические анализаторы, такие как RDFLib, будут генерировать исключение, если идентификатор не является допустимым IRI со схемой: раздел? Являются ли RDF-файлы с нелитералами, которые не являются действительными IRI, по-прежнему правильно сформированными, несмотря на терминологию, используемую в спецификации RDF?

[1] https://www.w3.org/TR/n-triples/#grammar-production-IRIREF

[2] https://github.com/cayleygraph/cayley/blob/master/data/testdata.nq

rdf n-triples n-quads

26.07.2016

Ответы:

Не поэтому ли некоторые примеры файлов имеют простые идентификаторы, в то время как другие синтаксические анализаторы, такие как RDFlib, выдают исключение, если идентификатор не является допустимым IRI со схемой: раздел?

Нет. Пример файла, на который вы указываете, строго говоря, не является синтаксически правильным N-Triples. На самом деле это вовсе не N-Triples, а N-Quads - другой синтаксис формат. Но даже если бы это были N-тройки, было бы неправильно иметь ИРИ в таком виде.

В Рекомендации N-Triples говорится, что «IRI могут быть записаны только как абсолютные IRI» (см. раздел 2.2) - абсолютные IRI определяются синтаксически в RFC 3987. Это является нормативным, даже если само производство грамматики не требует этого.

Однако IRI, которые вы видите в этом файле примера, могут быть интерпретированы как относительные ссылки IRI, и некоторые синтаксические анализаторы N-Triples были несколько расширены, чтобы разрешить разыменование относительных IRI с использованием базового IRI. Вероятно, поэтому вы иногда видите такие синтаксически неправильные файлы N-Triples в дикой природе. Это нестандартное расширение формата.

Являются ли RDF-файлы с нелитералами, которые не являются действительными IRI, по-прежнему правильно сформированными, несмотря на терминологию, используемую в спецификации RDF?

Это зависит от формата синтаксиса, который вы используете. Корректность — это свойство документа с конкретным конкретным синтаксисом, поэтому правила для N-Triples отличаются от правил, скажем, для Turtle или RDF/XML.

Сам RDF в своем абстрактном синтаксисе требует, чтобы IRI соответствовали RFC3987 и были абсолютными, поэтому любой документ RDF, который при обработке создает неразрешенные относительные IRI или IRI, не соответствующие RFC, если, возможно, не является неправильно сформированным, безусловно, недействителен. .

Некоторые конкретные форматы синтаксиса (такие как RDF/XML, TriG, Turtle и т. д.) предоставляют различные механизмы сокращения для IRI (префиксные имена, относительные IRI + базовый IRI и т. д.). Однако, как мы видели выше, N-Triples не имеет такого встроенного механизма сокращений, поэтому любой IRI, который не является абсолютным, делает документ некорректным.

27.07.2016

Новые материалы

Кластеризация: более глубокий взгляд

Кластеризация — это метод обучения без учителя, в котором мы пытаемся найти группы в наборе данных на основе некоторых известных или неизвестных свойств, которые могут существовать. Независимо от..

Как написать эффективное резюме

Предложения по дизайну и макету, чтобы представить себя профессионально Вам не позвонили на собеседование после того, как вы несколько раз подали заявку на работу своей мечты? У вас может..

Частный метод Python: улучшение инкапсуляции и безопасности

Введение Python — универсальный и мощный язык программирования, известный своей простотой и удобством использования. Одной из ключевых особенностей, отличающих Python от других языков, является..

Как я автоматизирую тестирование с помощью Jest

Шутка для победы, когда дело касается автоматизации тестирования Одной очень важной частью разработки программного обеспечения является автоматизация тестирования, поскольку она создает..

Работа с векторными символическими архитектурами, часть 4 (искусственный интеллект)

Hyperseed: неконтролируемое обучение с векторными символическими архитектурами (arXiv) Автор: Евгений Осипов , Сачин Кахавала , Диланта Хапутантри , Тимал Кемпития , Дасвин Де Сильва ,..

Понимание расстояния Вассерштейна: мощная метрика в машинном обучении

В обширной области машинного обучения часто возникает необходимость сравнивать и измерять различия между распределениями вероятностей. Традиционные метрики расстояния, такие как евклидово..

Обеспечение масштабируемости LLM: облачный анализ с помощью AWS Fargate и Copilot

В динамичной области искусственного интеллекта все большее распространение получают модели больших языков (LLM). Они жизненно важны для различных приложений, таких как интеллектуальные..

Machine Learning JavaScript Blockchain Artificial Intelligence Data Science Cryptocurrency Software Development Python Web Development Coding Deep Learning AI Bitcoin React Software Engineering Ethereum Web3 Business Crypto Nodejs Solidity Development Front End Development Data Finance Money Java Trading Typescript Smart Contracts Productivity Tech Startup Investing Neural Networks Developer Computer Science NLP