Андромеда Йелтон

JSTOR Labs недавно вернулись с конференции 2023 Code4Lib, где мы провели несколько докладов и семинаров, а также пообщались с замечательным сообществом библиотечных технологов. Рон Снайдер и Джулия Ха начали семинар перед конференцией по Juncture, а Мэтт Линкольн и Эми Кирххофф провели семинар по анализу текста с помощью Constellate. В течение следующих нескольких дней было несколько выдающихся докладов, таких как зомби-рассказ о потере и восстановлении данных Майка Кастеллека; Инструмент Аллана Берри для исследования библиотечных веб-сайтов с течением времени; и наш собственный поучительный и проникновенный доклад Райана Маккарти о предоставлении доступа к JSTOR в тюрьмах. Программный комитет также проделал большую работу по объединению доклада в тематические сегменты. Две большие темы, которые постоянно повторялись во время конференции — и могли бы вдохновить нас на работу, которую мы делаем здесь, в ITHAKA, — это искусственный интеллект и доступ к материалам с учетом культурных особенностей.

Варианты использования ИИ для библиотечных технологий

В области искусственного интеллекта несколько библиотек используют машинное обучение для крупномасштабного улучшения метаданных. Райден ван Бронкхорст и Чарли Коллетт рассказали об усилиях Калифорнийской цифровой библиотеки по дедупликации и исправлению библиографических записей из многочисленных учреждений. Эмили Лайнема рассказала о том, как Университет Индианы оцифровал более 300 000 мультимедийных объектов, многие из которых вообще не имеют описания. IU сейчас работает с партнерами над разработкой инструмента, который позволит архивариусам и машинному обучению работать вместе для эффективного описания этих элементов. Масштабы этих проектов намного превышают то, что могут сделать одни люди, и сообщество было в восторге от возможности сделать свои коллекции более доступными для обнаружения, хотя также было обеспокоено рисками ИИ.

В связи с этим Джейсон А. Кларк рассказал об ответственном проекте искусственного интеллекта в Университете штата Монтана. К настоящему моменту они провели обзор и проверку окружающей среды вариантов использования ИИ в библиотеках; кульминацией работы станет набор инструментов, который поможет библиотекам выполнять эту работу лучше. Этот проект нашел то, о чем говорят доклады Code4Lib: библиотекари хотят использовать машинное обучение для автоматизации улучшений метаданных, особенно для коллекций изображений. Однако он также напомнил нам, что многие библиотекари обеспокоены предвзятостью и прозрачностью при использовании такого рода технологий. Это согласуется с другой важной темой конференции — доступом к материалам с учетом культурных особенностей.

Доступ к коллекциям с учетом культурных особенностей

Майк Нейсон и Джули Ши выступили с удивительно забавным докладом о проекте по обнаружению и исправлению способов, которыми записи метаданных могут кодировать культурно-специфические предположения о языках, географии, личных именах и многом другом. (Насколько это может быть плохо? — спросили они. Ответ: довольно плохо). инструмент автоматизации циклов» для обновления метаданных коллекции об оккупации Филиппин США, которая в основном используется посетителями из Филиппин.

В то время как метаданные составляют основу многих интерфейсов библиотек, докладчики коснулись и других аспектов UX. Дэнни Нанес рассказал о том, как Университет Северной Каролины в Гринсборо обновил язык и дизайн веб-сайта о рабстве, чтобы они больше соответствовали теме. Маргарет Хеллер и Грир Мартин работают с Проектом народного права Лакота над сбором цифровой коллекции с использованием Мукурту, ​​CMS, основанной на принципах знаний коренных народов. Я сам говорил о вопросах, возникших у меня в ходе проекта машинного обучения для Библиотеки Конгресса о том, как этично реализовать такие инструменты, как поиск и автозаполнение.

Повышение доступности коллекций с помощью машинного обучения

Технически глубокий, но этически обоснованный подход сообщества является частью того, почему я всегда люблю посещать конференции Code4Lib. Также интересно взаимодействовать с ITHAKAn, потому что я думаю, что у нас почти уникальные возможности для решения некоторых из этих задач. Многие библиотеки заинтригованы возможностями повышения доступности своих коллекций с помощью машинного обучения, но лишь немногие из них располагают персоналом или крупномасштабными цифровыми коллекциями, необходимыми для продвижения этих инструментов; у нас есть оба. Работа требует чуткости и тщательного обдумывания, но кто знает, что мы могли бы открыть?

Андромеда Йелтон — инженер-программист в JSTOR Labs, входящей в состав ITHAKA, некоммерческой организации в области образовательных технологий, которая делает материалы для высшего образования более доступными.

Заинтересованы в поиске карьеры и вакансий в Анн-Арборе или Нью-Йорке с ITHAKA? Посетите нашу страницу вакансий ITHAKA, чтобы узнать больше и поговорить с рекрутером.