Historical Toponym Disambiguation

[This blog post is based on the Master thesis Information Sciences of Bram Schmidt, conducted at the KNAW Humanities cluster and IISG. It reuses text from his thesis]

Place names (toponyms) are very ambiguous and may change over time. This makes it hard to link mentions of places to their corresponding modern entity and coordinates, especially in a historical context. We focus on historical Toponym Disambiguation approach of entity linking based on identified context toponyms.

The thesis specifically looks at the American Gazetteer. These texts contain fundamental information about major places in its vicinity. By identifying and exploiting these tags, we aim to estimate the most likely position for the historical entry and accordingly link it to its corresponding contemporary counterpart.

Example of a toponym in the Gazetteer

Therefore, in this case study, Bram Schmidt examined the toponym recognition performance of state-of-the-art Named Entity Recognition (NER) tools spaCy and Stanza concerning historical texts and we tested two new heuristics to facilitate efficient entity linking to the geographical database of GeoNames.

Experiments with different geo-distance heuristics show that indeed this can be used to disambiguate place names.

We tested our method against a subset of manually annotated records of the gazetteer. Results show that both NER tools do function insufficiently in their task to automatically identify relevant toponyms out of the free text of a historical lemma. However, exploiting correctly identified context toponyms by calculating the minimal distance among them proves to be successful and combining the approaches into one algorithm shows improved recall score.

Bram’s thesis was co-supervised by Marieke van Erp and Romke Stapel. His thesis can be found here [pdf]

Share This:

0 thoughts on “Historical Toponym Disambiguation

  1. Не обращая внимания на тот факт, что БК 1xbet зеркало имеет реальную лицензию и оформлена на Кюрасао, Нидерландских Антильских островах, в Российской федерации ее сайт постоянно блокируется. Но клиентов конторы это не может беспокоить, поскольку руководство фирмы предприняло надлежащие шаги в правильном направлении, гарантировав всем своим посетителям способность прохода на интернет-сайт в любое время, даже при условии блокирования главного сайта 1xbet. Причины блокировки проекта В Российской федерации принят законопроект, который ограничивает или воспрещает функционирование букмекерских компаний, какие не исполняют последующие условия: Реальная регистрация на территории Российской Федерации, получение лицензии и оплата налогообложения в бюджет. Вход в состав СРО. Поскольку букмекерская контора уже имеет международную лицензию, ее субъекты посчитали требования страны повышенными, за что подверглась блокированию. В последнее время работы 1xbet на территории России по заключению судебного органа было блокировано более 500 доменных имен. Однако это не препятствует компании возобновлять работать, а ее клиентам пользоваться всеми разделами сайта, ставить и иметь выигрыш. Каким образом войти на блокированный сайт С целью обойти блокировку, представители фирмы предоставляют своим играющим вход к рабочим зеркалам 1xbet. Войти на работающую версию вебсайта возможно посредством гиперссылки 1xbet зеркало. Это несложный и комфортный метод использования БК. При применении рабочего зеркала хранятся все личные сведения, в том числе счета и аккаунт, к тому же рабочее зеркало в точности воспроизводит официальный портал. Он в такой же мере качественно предохранен и целиком не опасен для выполнения ставок, внесения и получения средств. Рабочее зеркало блокированного главного сайта – один из наиболее удобных методов дальнейшего продолжения проведения ставок без мизерного риска и затруднений.

Leave a Reply

Your email address will not be published. Required fields are marked *