In my first meeting this summer as a data science research assistant, we each followed our personal introductions with declarations of our favourite ice cream flavours. Mine was and continues to be Häagen Dazs’ Strawberry Cheesecake ice cream, and I was pleasantly surprised to learn someone else on the team felt the same. However, the biggest surprise was learning that someone enjoyed microwaving their ice cream to change its texture. At that point is it still ice cream? Is it soup? Or a milkshake? What even counts as ice cream? ...
7 articles tagués avec 'metadata '
Voir tous les tagsJessica et Goliath - Apprendre 3M et CIDOC CRM
Au cours de mes cours d'études supérieures à la Faculté de l'information de l'Université de Toronto, j'ai acquis une compréhension de haut niveau des Linked Open Data (LOD) et CIDOC CRM ontologie, un outil théorique et pratique pour l'intégration de l'information dans le domaine du patrimoine culturel. Parce que je suis un étudiant en Archives & Records Management, je ne m'attendais pas à comprendre LOD et CIDOC CRM à un degré significatif, et certainement pas dans la mesure où mon poste de spécialiste des métadonnées coopérative au LINCS l'exige...
Le navire de Thésée - Représenter la nuance dans les données des sciences humaines
Si chaque partie d'un navire a été remplacée au fil du temps, quand, si jamais, devient-il un nouveau navire ?
Héraclite, Platon et d'autres ne savaient pas que les problèmes posés par le paradoxe du "Vaisseau de Thésée" continueraient à vexer les humanistes numériques au XXIe siècle...
Le spécialiste des métadonnées "assez bon"
Mon premier emploi dans le domaine des musées remonte à 2008, au plus fort de la Grande Récession. L'équipe de numérisation que j'ai rejointe venait de perdre environ un quart de son personnel dans une série de rachats et de licenciements, et l'ambiance était sombre. Nous étions chargés de mettre en ligne une grande collection de photographies historiques, et le plus tôt serait le mieux. Le seul problème était que la collection n'était pas entièrement cataloguée, et le faire correctement prendrait du temps que nous n'avions pas. La pression était forte pour justifier nos travaux, et donc les discussions que nous avons eues sur les métadonnées penchaient vers le provisoire. Si la base de données n'est pas remplie, le numéro d'accession seul suffit-il ? D'accord, qu'en est-il du numéro d'accession et de l'artiste ? Les solutions que nous avons proposées reflétaient les facteurs de stress de ce moment : nous visions quelque chose d'assez bon au lieu de quelque chose d'exemplaire, en équilibrant soigneusement les exigences en matière de données avec la volonté de générer du contenu.
Au cours de la décennie et demie qui a suivi, le parent "assez bon" de Winnicott a été un principe directeur dans mon rôle de gardien des données...
Qu'est-ce que la charge de transformation d'extraction ?
En science des données, il existe un processus couramment utilisé appelé Extract-Transform-Load (ETL). L'ETL comprend trois étapes principales :
- Extraire des données d'une source,
- Transformer les données via le nettoyage et la manipulation des données, et
- Charger les données transformées dans un entrepôt de données (la collection finale de données) (Sethi, 2018)
Avant d'avoir beaucoup d'expérience dans le traitement des données, mon collègue Devon et moi n'étions pas sûrs de ce qu'était ETL. Maintenant, après avoir transformé conjointement un ensemble de données entier à partir de XML à une toute nouvelle structure utilisant triples utilisant CIDOC CRM, on commence à comprendre le processus...
Créer des opportunités - Travailler à distance avec les collections d'art canadien
À l'été 2020, j'ai été embauchée comme assistante de recherche à la Bachinski/Chu Print Study Collection de l'Université de Guelph. Initialement, mon travail impliquait le soin et l'entretien des objets de la collection avec quelques autres tâches assignées. Bien sûr, l'arrivée de la pandémie de COVID-19 a signifié que j'ai passé tout l'été à ne pas travailler avec les objets eux-mêmes, mais plutôt à faire des recherches approfondies depuis chez moi, en utilisant toutes les sources en ligne que j'ai pu trouver. Cela s'est avéré difficile car, bien que la collection regorge d'objets de différentes dates et créateurs, elle est en grande partie composée d'œuvres de graveurs canadiens du milieu à la fin du XXe siècle qui ont une présence en ligne limitée...
Éliminer les obstacles à la conversion des données
S'il y a une chose que j'ai apprise au cours de mes études supérieures en bibliothéconomie, archivistique et information, c'est que les institutions de l'information sont hostiles au changement. La profession d'archiviste progresse à un rythme glacial. Cela se juxtapose avec les sauts et les limites réalisés dans les technologies de l'information au cours des vingt-cinq dernières années. À première vue, il n'est pas logique que de nombreuses bibliothèques utilisent encore le format désuet MARC pour leurs notices bibliographiques, ou pourquoi les institutions d'archives au Canada toujours mandaté pour utiliser la version 2008 des règles de description archivistique, qui n'a pas de véritable solution pour décrire les documents électroniques...