mathstodon.xyz is one of the many independent Mastodon servers you can use to participate in the fediverse.
A Mastodon instance for maths people. We have LaTeX rendering in the web interface!

Server stats:

2.8K
active users

#tei

0 posts0 participants0 posts today
Replied to Christian Thomas

@dta_cthomas @emchateau In this case I was mostly digging up things that I already knew from about 15-20 years ago so I mainly used reference sites rather than tutorials. Mozilla Developer Network seems pretty good for that developer.mozilla.org/en-US/do

That said, I had a quick scan of M H Beals' "Transforming Data for Reuse and Re-publication with XML and XSL" on Programming Historian and that seems pretty good. It's focused specifically on #TEI too programminghistorian.org/en/le

The MDN Web Docs logo, featuring a blue accent color, displayed on a solid black background.
MDN Web DocsXSLT: Extensible Stylesheet Language Transformations - XML: Extensible Markup Language | MDNExtensible Stylesheet Language Transformations (XSLT) is an XML-based language used, in conjunction with specialized processing software, for the transformation of XML documents.

I have been doing #XML stuff this week, specifically #TEI. I know a lot of people don't really like #XSLT, but it reminded me that when you're working with something that's not just structured data but a stream of text where some or all of the markup is part of the flow then that hybrid imperative/declarative model works really well for representing the full range of transformations you might want to make.

Would be interested to know if there are good modern alternatives.

Continued thread

🧵 2/2
tl;dr #neurodivergent #freeassociation #musings

Combining proof-reading with textual markup and manual entity recognition, it becomes the perfect hyper focus activity.
I use #Transkribus for my #HTR and for the last few days, I have been unlucky with the traffic for both model training and text recognition. The queues are long and take a lot of time and I am deprived of my error hunting and current hyper fixation on #Mongolia #BogdKhanate #EasternChina #TravelDiaries #TEI #Encoding

📢 Releasing tei-rdfa (beta)

▶️ Python utility for extracting RDFa data from TEI-XML documents
▶️ Resolves native TEI namespace formatting (through <prefixDef>)

🌐 pypi.org/project/tei-rdfa/
🌐 github.com/timofruehwirth/tei_

We welcome beta testing, feedback & contribution via #GitHub.
Boosts will be very much appreciated.

@ACDHCH_OeAW @oeaw @fwf @TEIConsortium @w3c @hcayless

PyPItei-rdfaA Python utility for extracting RDFa data from TEI-XML documents.
#TEI#XML#RDFa

📚 Extracting Citations with LLMs

At the #LLM for HPSS workshop, @cmboulanger David Carreto Fidalgo & Andreas Wagner presented LLaMore: a Python tool for extracting citation data from unstructured legal & humanities texts using #LLMs

Unlike GROBID, LLaMore handles complex footnotes and free-form references. Early results with GPT-4o and Llama 3.3 show significantly higher accuracy when benchmarked against a new gold standard TEI-annotated dataset.

#TEI #openscience @maxplanckgesellschaft

Digitales Manuskript?! Exkursionstag am 2. April 2025 im #lwlarchivamt & Technischen Zentrum des #LandesarchivNRW in Münster für Studierende & Forschende der #unimuenster.

Programm: 3D- & Multispektraldigitalisierung, Bundessicherungsverfilmung, Restaurierungsworkshops & Diskussionen zu Originalerhalt/DH-Methoden.

Außerdem #TEI Schulungen des @scdh im Rahmen der Frühlingsschule.

Infos: uni-muenster.de/EvTheol/gkm/fo

Two things today:
📣 The Centre for Ibsen Studies has one or two short term #XML #TEI encoding job. Look at the job offer on Jobbnorge.no jobbnorge.no/ledige-stillinger

📘 We finally published the proceedings for the Nordic Network for Edition Philologists conference held in Oslo, in fall 2022. Both conference and proceedings struggled with pandemics and other difficult circumstances. Anyways! Out now and will be available shortly on the website of the network: nnedit.org/vol/nne_vol_15.pdf

Jobbnorge.noProsjektmedarbeider i digital tekstutgivelse (277540) | Universitetet i OsloStillingstittel: Prosjektmedarbeider i digital tekstutgivelse (277540), Arbeidsgiver: Universitetet i Oslo, Søknadsfrist: tirsdag 15. april 2025

Heut und morgen in Essen zur Konferenz "#WordsInNumbers #Data-Driven Approaches to Texts in the #Humanities and #SocialSciences", runip-projekt.ruhr-uni-bochum., mit S. Dipper, @felwert, J. Wieringa, J. Guldi u.a.

Ich darf die #DigitalScholarlyEditions zu #Goethe u #Humboldt vorstellen, die #ResearchData für #DigitalHumanities Ansätze liefern. Im Zentrum: die #TEI-XML-Daten der #ehd_v10 github.com/telota/edition-humb u aus den Propyläen goethe-biographica.de/recherch.

Bin gespannt auf die Vorträge aller anderen!

Continued thread

In einem gemeinsamen Workshop der Konsortien @NFDI4Memory , @nfdi4objects und @Textplus auf der #DHd2025 wurde anhand konkreter Use Cases eine Einführung in #DublinCore, #TEI und #LIDO vermittelt, die Bedeutung von #Normdaten und #Terminologien betont und die #Minimaldatensatz-Empfehlung für #Museen und #Sammungen vorgestellt. Die Folien finden sich bei Zenodo: zenodo.org/records/15052040

#FAIR #CARE #NFDI #Text+ #NFDI4Memory #NFDI4Objects #Datenharmonisierung #Datenqualitaet 2/2

ZenodoQualitativ hochwertige Metadaten in digitalen EditionenMaterialien zum Workshop "Qualitativ hochwertige Metadaten in digitalen Editionen“, der im Rahmen der „DHd 2025: Under Construction“ in Bielefeld von Mitarbeiter:innen der NFDI-Konsortien Text+, NFDI4Memory, NFDI4Objects, der Verbundzentrale des GBV und dem Institut für Museumsforschung gehalten wurde. Ziel des Workshops war die praxisnahe Vermittlung von Wissen zur Bewertung und Verbesserung der Qualität von Metadaten in digitalen Editionen. Ausgehend von konkreten Fallbeispielen in Form verschiedener Überlieferungssituationen von Briefen (neu zu erschließen, Abschrift, indirekter Hinweis) wurden die Problemfelder aufgerissen, die hinsichtlich der Beschreibung der verschiedenen Arten von Metadaten auftreten können. Drei Übungsblöcken waren jeweils kurze thematischen Einführungen zu den Basisthemen Metadaten, Normdaten und kontrollierten Vokabularen, Dublin Core, LIDO sowie Datenqualität und Datenkuratierung vorangestellt. In den Praxisübungen arbeiteten die Teilnehmer:innen in Gruppen oder eigenständig mit den Metadaten-Standards Dublin Core, LIDO und TEI-XML. Die Übungen zielten darauf ab, die Erstellung von Metadatensets, auch anhand von Metadateneditoren, zu erproben und aus der eigenen Erfahrung Methoden zur Bewertung der Qualität und zur Bereinigung eigener bzw. bereits vorhandener Metadatensets zu entwickeln.

#eeditiones community meetup Tuesday, the 1st of April at 17:00 CEST.

Talk: "From Library Platforms to a Generic Archive Edition" by Daniela Kohler, Jesko Reiling and Elias Kreyenbühl from the Zentralbibliothek Zürich.

Just over a year ago, we began editing the letters of the music publishers and composers Hans Georg Nägeli (1773-1836) and Hermann Nägeli (1811-1872)...

Read more at: e-editiones.org/posts/communit

Ever wondered what a genetic edition actually is? Was it just a fairytale that scholars do not need to become web developers to publish their digital editions? And what exactly Hans Christian Andersen has to do with all this? Watch Holger Berg provide all the answers and more in his e-editiones community lecture “Genetic editions of Hans Christian Andersen's oeuvre”.

e-editiones.org/posts/communit

www.e-editiones.orgGenetic editions of Hans Christian Andersen's oeuvree-editiones – Society for Scholarly Digital Editions
Continued thread

@Textplus @NFDI4Memory

Da dieser Workshop aufgrund des wichtigen Themas sehr schnell ausgebucht war, finden Sie hier das Abstract: zenodo.org/records/14943264.

#DHd2025 #Metadaten #Normdaten #Terminologien #Vokabulare #digitaleEditionen #Datenqualität #Minimaldatensatz #TEI #LIDO #DublinCore #Personennamen #Ortsnamen #Standardisierung

Wir freuen uns auf den Austausch, sowohl auf der DHd als auch danach.

ZenodoQualitativ hochwertige Metadaten in digitalen EditionenMetadaten sind der zentrale Schlüssel, um Datenpublikationen verfügbar, indexierbar und verknüpfbar zu machen. Sie geben Aufschluss über die Provenienz, Erfassung und Bearbeitung von Daten und ermöglichen den Communities, die Daten nachnutzen möchten, eine Kontextualisierung ihrer Entstehungsbedingungen. Reich an potentiellen Metadatenquellen stellen Editionen – digitale wie analoge – durch Register, Apparate, Personen- und Ortsnamen sowie die Dokumentation von Textbearbeitungsstufen die Erfassung mittels standardisierter Formate vor besondere Herausforderungen. Der Workshop fokussiert die Erzeugung standardbasierter Metadatensets von und für die Erarbeitung von Editionen unter dem Gesichtspunkt von Metadatenqualität. Im Workshop werden daher praxisnah Kenntnisse zur Bewertung und Verbesserung der Qualität von Metadaten in digitalen Editionen vermittelt. Zu den Kernelementen zählen Praxisübungen in Kleingruppen anhand konkreter Use Cases (Dublin Core, LIDO) und für die Herstellung digitaler Editionen relevanter Metadaten-Standards. Den Hands-On-Phasen vorangestellt sind konzise Einführungen zu den Feldern und Standards von Metadatenformaten, kontrollierten Vokabularen, Aspekten der Datenqualität und Phasen der Datenkuratierung.
Replied in thread

@A_v_Humboldt_Chronologie der Vortrag wurde von #Humboldt später publiziert in seinen publikumswirksamen „Ansichten der Natur“ unter dem Titel: „Ideen zu einer Physiognomik der Gewächse“. Gabs dann auch als Separatdruck, hier ein besonderes Exemplar mit Widmung an den
„Herrn Geh. Rath v. #Goethe
als ein schwaches Zei[-]
chen seiner dankbare[n]
Verehrung“
👉 #DeutschesTextarchiv der @BBAW : deutschestextarchiv.de/humbold
#DigitalHumanities #TEI-XML

www.deutschestextarchiv.deDeutsches Textarchiv – Humboldt, Alexander von: Ideen zu einer Physiognomik der Gewächse. [Tübingen], [1806].