The Technological Developments of the Dutch Folktale Database (1994–2016)

Theo Meder

Resum

L’any 1994, la base de dades holandesa de contes populars va començar com una base de dades independent i es va posar en línia el 2004. Des de l’any 2016 i després de dos projectes importants, tots els tipus de metadades es poden afegir de manera automàtica i semisupervisada: idiomes, noms, paraules clau, resums, subgèneres, motius i tipus de contes. Amb aquesta finalitat, la base de dades va analitzar una nova plataforma anomenada Omeka que s’adapta a les necessitats de moltes bases de dades en les humanitats, i que pot gestionar tot tipus de connectors. S’han utilitzat les tècniques següents: n-grames, detecció del llenguatge, reconeixement d’entitats nombrades, extracció de paraules clau, resum, bossa de paraules, aprenentatge automàtic i processament de llenguatge natural. A més de MOMFER, també s’ha afegit un motor de cerca de motius. La interpretació de dades es facilita amb els nous mitjans de visualització: mapes geogràfics, línies de temps, una xarxa de contes similars i núvols de paraules. Com que la base de dades compleix els requisits de Dublin Core, es pot connectar a bases de dades similars o a un recol·lector de dades. Recentment, s’ha creat una aplicació de mineria de dades transatlàntica per construir un recol·lector anomenat ISEBEL: Intelligent Search Engine for Belief Legends (motor de cerca intel·ligent de llegendes de creences). El recol·lector ha de ser capaç de buscar en una  base de dades holandesa, danesa i alemanya simultàniament. Més endavant s'hi poden afegir altres bases de dades.

Paraules clau

rondalla; base de dades; visualització; recol·lector; humanitats en línia

Text complet:

PDF (English)

Referències


BAUGHMAN, Ernest W. (1966): Type and Motif-Index of the Folktales of England and North-America. The Hague: Mouton & Co.

KARSDORP, Folgert (2013): “Het is groen en leeft nog lang en gelukkig: Classificatie van volksverhaalgenres op basis van formules”. Tijdschrift voor Nederlandse Taal- en Letterkunde vol. 129, no. 4: 274–288.

KARSDORP, Folgert (2016): Retelling Stories: A Computational-Evolutionary Perspective. Nijmegen.

KARSDORP, Folgert; Antal VAN DEN BOSCH (2013): “Identifying Motifs in Folktales Using Topic Models”. In Proceedings of the 22 Annual Belgian-Dutch Conference on Machine Learning, pp. 41–49.

KARSDORP, Folgert; Peter VAN KRANENBURG; Theo MEDER; Antal VAN DEN BOSCH (2012a): “Casting a Spell: Identification and Ranking of Actors in Folktales”. In F. MAMBRINI; M. PASSAROTTI; C. SPORLEDER (eds.): Proceedings of the Second Workshop on Annotation of Corpora for Research in the Humanities (ACRH-2). Lisbon: Edições Colibri, pp. 39–50.

Karsdorp, Folgert; Peter van Kranenburg; Theo Meder; Dolf Trieschnigg; Antal VAN DEN BOSCH (2012b): “In search of an appropriate abstraction level for motif annotations”. In Computational Models of Narrative workshop (LREC 2012). Istanbul.

KARSDORP, Folgert; Marten VAN DER MEULEN; Theo MEDER; Antal VAN DEN BOSCH (2015a): “MOMFER: A Search Engine of Thompson’s Motif-Index of Folk Literature”. Folklore no. 126: 37–52.

KARSDORP, Folgert; Marten VAN DER MEULEN; Theo MEDER; Antal VAN DEN BOSCH (2015b): “Animacy Detection in Stories”. In M. FINLAYSON; B. MILLER; A. LIETO; R. RONFARD (eds.): Proceedings of the Workshop on Computational Models of Narrative (CMN’15). OpenAccess Series in Informatics 45. Atlanta, pp. 82–97.

MEDER, Theo (2010): “From a Dutch Folktale Database towards an International Folktale Database”. Fabula no. 51 (1/2): 6–22.

MEDER, Theo (2012): Avonturen en structuren: op zoek naar de bouwstenen van volksverhalen. Amsterdam: Meertens Instituut.

MEDER, Theo (2014): “The Folktale Database as a Digital Heritage Archive and as a Research Instrument”. In Meyer HOLGER; Christoph SCHMITT; Stefanie JANSSEN; Alf-Christian SCHERING (eds.): Corpora ethnographica online. Strategien der Digitalisierung kultureller Archive und ihrer Präsentation im Internet. Münster: Waxmann, pp. 119–128.

MEDER, Theo; Peter BURGER (2006): “«A Rope Breaks. A Bell Chimes. A Man Dies». The Kwispel: A Neglected International Narrative Riddle Genre”. In P. CATTEEUW; M. JACOBS; S. RIEUWERTS et alii (eds.): Toplore. Stories and Songs. Trier: Wissenschaftlicher Verlag Trier, pp. 28–38.

MEDER, Theo; Folgert KARSDORP; Dong NGUYEN; Mariët THEUNE; Dolf TRIESCHNIGG; Iwe EVERHARDUS; Christiaan MUISER (2016): “Automatic Enrichment and Classification of Folktales in the Dutch Folktale Database”. Journal of American Folklore vol. 129, no. 511: 78–96.

MEDER, Theo; Dong NGUYEN; Rilana GRAVEL (2016): “The Apocalypse on Twitter”. Digital Scholarship in the Humanities no. 31 (2): 398–410.

MUISER, Iwe; Mariët THEUNE; Theo MEDER (2012): “Cleaning up and Standardizing a Folktale Corpus for Humanities Research”. In Second Workshop on Annotation of Corpora for Research in the Humanities. Lisbon, pp. 63–74.

NGUYEN, Dong (2017): Text as Social and Cultural Data: A Computational Perspective on Variation in Text. Enschede.

NGUYEN, Dong; Dolf TRIESCHNIGG; Theo MEDER; Mariët THEUNE (2012): “Automatic Classification of Folk Narrative Genres”. In First International Workshop on Language Technology for Historical Text(s) (KONVENS 2012). Vienna, pp. 378–382.

NGUYEN, Dong; Rilana GRAVEL; Dolf TRIESCHNIGG; Theo MEDER (2013): “«How Old Do You Think I Am?»: A Study of Language and Age in Twitter”. In Proceedings of the Seventh International AAAI Conference on Weblogs and Social Media. AAAI Publications, pp. 439–448.

NGUYEN, Dong; Dolf TRIESCHNIGG; Mariët THEUNE (2013): “Folktale Classification Using Learning to Rank”. In P. Serdyukov et alii (eds.): Proceedings of ECIR 2013. Springer, pp. 195–206.

NGUYEN, Dong; Dolf TRIESCHNIGG; Mariët THEUNE (2014): “Using Crowdsourcing to Investigate Perception of Narrative Similarity”. In Proceedings of the 23rd ACM International Conference on Conference on Information and Knowledge Management. ACM, pp. 321–330.

NGUYEN, Dong; Dolf TRIESCHNIGG; Theo MEDER (2014): “TweetGenie: Development, Evaluation, and Lessons Learned”. In: Proceedings of COLING 2014, the 25th International Conference on Computational Linguistics: System Demonstrations. Dublin, pp. 62–66.

THOMPSON, Stith (1955-58): Motif-Index of Folk-literature. A Classification of Narrative Elements in Folktales, Ballads, Myths, Fables, Medieval Romances, Exempla, Fabliaux, Jest-Books, and Local Legends. 6 vols. Bloomington: Indiana University Press.

TRIESCHNIGG, Dolf; Djoerd HIEMSTRA; Mariët THEUNE; Franciska DE JONG; Theo MEDER (2012): “An Exploration of Language Identification Techniques for the Dutch Folktale Database”. In Workshop on Adaptation of Language Resources and Tools for Processing Cultural Heritage (LREC 2012). Istanbul, pp. 47–51.

TRIESCHNIGG, Dolf; Dong NGUYEN; Theo MEDER (2013): “In Search of Cinderella: A Transaction Log Analysis of Folktale Searchers”. In Proceedings of the First ACM SIGIR Workshop on the Exploration, Navigation and Retrieval of Information in Cultural Heritage. Dublin.

TRIESCHNIGG, Dolf; Dong NGUYEN; Mariët THEUNE (2013): “Learning to Extract Folktale Keywords”. In 7th Workshop on Language Technology for Cultural Heritage, Social Sciences, and Humanities, LaTeCH. Sofia, pp. 65–73.

UTHER, Hans-Jörg (2004): The types of international folktales. A classification and bibliography based on the system of Antti Aarne and Stith Thompson. 3 vols. Folklore Fellows’ Communications 284, 285, 286. Helsinki: Suomalainen Tiedeakatemia.




DOI: https://doi.org/10.17345/elop201645-69