Компьютерочитаемая информация с помеченными счетами

Существуют ли веб-сайты, на которых есть законопроекты, резолюции и т. д., помеченные машиночитаемой тематической информацией, например:

Если мы говорим об этом -> HR 3547: "Закон о расширении ответственности за космический запуск". Он может быть помечен тегами «НАСА», «Исследования» и другими (спорными, я уверен) тегами.

Чего вы надеетесь достичь? Возможно, вы задаете неправильный вопрос.
Есть много применений для этого типа информации. Но мой особый интерес представляет проект программирования для демонстрации для класса, который сопоставляет шаблоны голосования с проблемами. Конгрессмен голосует «за» по законопроектам с пометкой «НАСА».
Должны ли счета быть «помечены»? Разве простого текстового поиска по всему счету не будет достаточно?
Я должен был бы сообщить ему список элементов, которые нужно искать, и если бы я собирался полагаться на компьютер, который сделает это за меня, это совершенно другой класс, использующий обработку естественного языка. Я собирался изучать теорию графов.
@ user1873 - Черт возьми. Правильный семантический анализ текста затруднен
Особенно с такой запутанной вещью, как тексты счетов! -------- Кроме того, эта тема здесь, в отличие от Programmers.SE или SO?
Я думаю, что машиночитаемость счетов помогает людям синтезировать данные, чтобы сделать общественность информированной. Поэтому я думаю, что это должно быть частью любой политической дискуссии. Не говоря уже о том, что я попал в целевую аудиторию и получил ответ.
@Bobson, просмотрев множество сайтов обмена стеками, я нашел тот, который может быть более подходящим. Так что, если у кого-то достаточно статуса, чтобы перенести вопрос на этот сайт, сделайте это. opendata.stackexchange.com

Ответы (2)

Я не особо вникал в это, но похоже, что у GovTrack.US есть API, который вы можете использовать.

https://www.govtrack.us/developers

https://www.govtrack.us/developers/api


Также кажется, что вы можете искать счета по предметной области, что, я думаю, очень похоже на теги, которые вы ищете.

сроки:

Тематические области, связанные с законопроектом. Возвращается в виде списка диктов JSON (или эквивалента в других выходных форматах). Возвращается только в запросе для одного объекта.

Фильтруется операторами. Сортируемый. При фильтрации укажите идентификатор одного целевого >объекта, чтобы проверить, есть ли цель среди значений этого поля.

И, судя по их страницам, у них есть много других показателей, которые вы можете использовать.

На официальном сайте Конгресса ( Congress.gov ), пришедшем на смену Thomas.Gov, есть текст и статус большинства законопроектов, но нет API. Как поясняется в этой статье , цель модернизации веб-сайта не слишком далеко продвинулась с открытыми стандартами.

В дополнение к https://www.govtrack.us/ , у которого есть API, вы также можете проверить неправительственный сайт https://www.opencongress.org/ , на котором есть аналогичные данные. В частности, Open Congress отслеживает счета и имеет ссылку https://www.opencongress.org/issues для проблем, которые они объединяют одним способом.

Кроме того, разработка «официальной» таксономии векселей, обслуживаемых правительственной организацией, скорее всего, будет весьма сложной задачей. Если система открыта для надзора со стороны правительства, давление на конгрессмена с целью обыграть систему с помощью ее ярлыков будет значительным, что снизит ее эффективность. В зависимости от того, хочет ли заинтересованная сторона, чтобы законопроект был более или менее известен (что непосредственно влияет на его шансы на принятие), соблазн возиться с его классификацией будет просто слишком велик.

Истинный. Произойдет возня с тегами. Это предполагает важность нескольких тегов. Но если бы в счете было 10-20 менее важных тегов (не говоря уже о тегах пассажиров), то у вас была бы более четкая картина мыслей всего счета.