Рекомендации по цифровому кодексу Торы для разработчиков программного обеспечения

Может ли кто-нибудь порекомендовать источник машиночитаемого иврита с английским кодексом Торы, который можно использовать в проектах по разработке программного обеспечения?

Под «машиночитаемым» я подразумеваю формат, к которому можно получить программный доступ и выполнить поиск в соответствии с критериями, указанными читателем. Возможные цифровые форматы могут включать текстовый файл ASCII, файл XML или широко используемый формат базы данных.

Здравствуйте и добро пожаловать в Mi Yodeya! Не могли бы вы отредактировать свой вопрос, чтобы добавить немного больше требований? Что делает источник полезным для разработки программного обеспечения? Например, есть ли требования к форматированию? Лицензионные?
Я не уверен, что это то, что вы ищете ( я все еще не уверен, что понимаю определение «машиночитаемый» ), но вам следует взглянуть на ответы на этот вопрос .
Shokhet, Большое спасибо за ваш ответ. Под машиночитаемым я подразумеваю формат, к которому можно получить программный доступ и выполнить поиск в соответствии с критериями, указанными читателем. Возможные цифровые форматы могут включать текстовый файл ASCII, файл XML или широко используемый формат базы данных.
Ах. Итак, я собирался пометить этот вопрос как дубликат другого, но этот добавляет к вопросу английский язык, так что это отдельный вопрос. Удачи в поиске ответа!
Совет для вас: если вы хотите быть уверены, что кто-то (помимо владельца поста) увидит ваш ответ на его комментарий, вы должны написать его имя пользователя, перед которым ставится @символ . ( см. meta.judaism.stackexchange.com/q/2067/5323 ). Я не видел вашего ответа, пока не вернулся к вопросу.
Дополнительный совет: разъяснения следует редактировать в самом вопросе, а не хоронить в комментариях, где их никто не увидит. Затем вы можете прокомментировать (используя @-notifications как предложено), чтобы человек, обратившийся за разъяснением, знал, что его предложение было принято. (Кстати, иврит ASCII маловероятен, хотя я полагаю, что это возможно, если вы готовы принять транслитерированный иврит.)
@TRiG Я бы отредактировал это у себя, за исключением того факта, что слова «машиночитаемый» не появлялись в этом вопросе, а скорее в другом вопросе, на который я ссылался ранее. Я заявлял о непонимании другого вопроса; Я думал, что это было достаточно ясно.
@TRiG, ​​не могли бы вы пояснить, почему иврит ASCII маловероятен? Вроде предусмотрено спецификацией. Является ли соглашением, что контент на иврите, скорее всего, будет использовать стандарт, отличный от ASCII, не являющийся американским («А»)?
Я не знаю, почему эта страница называет себя «таблицей ASCII для иврита». Это кодовая страница 862. Это одна из многих кодировок, которые представляют собой ASCII плюс что-то еще. Их иногда называют «расширенными ASCII», но это не совсем правильное имя для них. Единственное правильное имя — «Кодовая страница Windows 862».

Ответы (2)

Sefaria — отличный ресурс для такого рода вещей.

См. их документацию для разработчиков и условия использования для получения дополнительной информации.

Они возвращают результаты в формате JSON или JSONP. У каждого перевода есть свои проблемы с авторскими правами, с которыми вам придется разбираться отдельно.

Тем не менее, «кодекс» может быть слишком строгим термином, когда речь идет о переводах.

Текст на иврите, лежащий в основе Sefaria Miqra (отличный сайт!), является (отраслевым стандартом) Вестминстерским Ленинградским кодексом - он лицензирован CC, без ограничений . Сравните также микру в соответствии с месорой , которая является CC-BY-SA; подробности см. в файле Readme. Я не уверен в API и т. д. в любом случае, за исключением того, что Westminster доступен в формате XML. Возможно, стоит также отметить проект TanakhML , в котором есть несколько интересных особенностей.
@Davïd Похоже, вы могли бы опубликовать свой собственный ответ.

mechon-mamre.org

Если вам нужен иврит и английский, у них есть http://mechon-mamre.org/p/pt/pt0.htm (с использованием перевода JPS).

Я не знаю подробностей о проблемах с разрешениями.

В противном случае попробуйте викитекст.

«Вы можете использовать материалы с этого сайта только для личного изучения и обучения, а не для публикации в любой форме, включая любой веб-сайт. В соответствии с нашим либеральным пониманием Доктрины добросовестного использования вы можете использовать несколько коротких цитат с нашего сайта в любом другую работу, включая публикации, защищенные авторским правом. Любое другое использование требует от нас письменного разрешения». С mechon-mamre.org
@Scimonster. Ах, спасибо. Вопрошающий хочет чего-то ближе к общественному достоянию, я так понимаю?