Using FLOSS for Storing, Processing and Linking Corpus Data

Damir Mukhamedshin; Olga Nevzorova; Alexander Kirillovich

doi:10.1007/978-3-030-47240-5_17

Conference Papers Year : 2020

Using FLOSS for Storing, Processing and Linking Corpus Data

(1) , (1) , (1)

Damir Mukhamedshin

Function : Author
PersonId : 1132701

Kazan Federal University

Olga Nevzorova

Function : Author
PersonId : 1132702

Kazan Federal University

Alexander Kirillovich

Function : Author
PersonId : 1132703

Kazan Federal University

Abstract

Corpus data is widely used to solve different linguistic, educational and applied problems. The Tatar corpus management system (http://tugantel.tatar) is specifically developed for Turkic languages. The functionality of our corpus management system includes a search of lexical units, morphological and lexical search, a search of syntactic units, a search of N-grams and others. The search is performed using open source tools (database management system MariaDB, Redis data store). This article describes the process of choosing FLOSS for the main components of our system and also processing a search query and building a linked open dataset based on corpus data.

Keywords

Corpus linguistics Corpus manager Linked open data

Domains

Computer Science [cs]

Fichier principal

496591_1_En_17_Chapter.pdf (519.47 Ko)

Origin	Files produced by the author(s)

Hal Ifip : Connect in order to contact the contributor

https://inria.hal.science/hal-03647263

Submitted on : Wednesday, April 20, 2022-1:41:43 PM

Last modification on : Wednesday, April 20, 2022-3:50:17 PM

Long-term archiving on : Thursday, July 21, 2022-7:23:26 PM

Dates and versions

hal-03647263 , version 1 (20-04-2022)

Licence

Attribution

Identifiers

HAL Id : hal-03647263 , version 1
DOI : 10.1007/978-3-030-47240-5_17

Cite

Damir Mukhamedshin, Olga Nevzorova, Alexander Kirillovich. Using FLOSS for Storing, Processing and Linking Corpus Data. 16th IFIP International Conference on Open Source Systems (OSS), May 2020, Innopolis, Russia. pp.177-182, ⟨10.1007/978-3-030-47240-5_17⟩. ⟨hal-03647263⟩

Export

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

IFIP IFIP-AICT IFIP-TC IFIP-WG IFIP-OSS IFIP-TC2 IFIP-WG2-13 IFIP-AICT-582

32 View

33 Download

Using FLOSS for Storing, Processing and Linking Corpus Data

Abstract

Keywords

Domains

Dates and versions

Licence

Identifiers

Cite

Export

Collections

Altmetric

Share