Представление о том, что человеческое суждение загрязняет научные попытки понять природные явления такими, какие они есть на самом деле, может показаться стабильной и неоспоримой ценностью. Однако, как установили Лоррейн Дастон и Питер Гэлисон, объективность — это довольно недавнее историческое явление.
В рассказе Дастона и Гэлисона, который фокусируется на научной визуализации, объективность возникла в 19 веке, одновременно с развитием фотографии. До появления фотографии научная иллюстрация пыталась изобразить идеальный образец, а не реально существующий экземпляр. Другими словами, вместо того, чтобы нарисовать реалистичный портрет отдельной плодовой мушки, обладающей уникальными, идиосинкразическими характеристиками, научный иллюстратор 18 века нарисовал идеальную плодовую муху. Это идеальное представление лучше передало бы средние характеристики плодовой мушки, даже несмотря на то, что ни одна реальная плодовая мушка никогда не бывает идеально средней.
С появлением фотографии рисунки идеальных типов стали терять популярность. Считалось, что механический глаз объектива позволяет природе говорить самой за себя, предоставляя доступ к более истинной, объективной реальности, чем человеческий глаз иллюстратора. Однако Дастон и Гэлисон подчеркивают, что эта первоначальная уверенность в чистоте зрения машины была быстро подорвана. Ученые вскоре поняли, что фотографические устройства вносят свои собственные искажения в создаваемые ими изображения и что ни один глаз не дает непосредственного представления о природе. С точки зрения научной визуализации идея о том, что машины позволяют нам видеть истину, давно устарела. Однако в повседневном дискурсе сохраняется тенденция характеризовать цель как то, что говорит само за себя без вмешательства человеческого восприятия, интерпретации, суждения и так далее.
The idea that machines allow us to see true has long been outmoded. / Идея о том, что машины позволяют нам видеть истину, давно устарела.
Это повседневное определение объективности особенно влияет на наше понимание процесса сбора данных. Если в нашей повседневной жизни мы склонны упусксбор данныхать из виду разнообразные, ситуативно структурированные смыслообразующие действия, которые выполняют ищущие информацию, слушатели разговоров и другие получатели коммуникативных актов для обеспечения функционирования автоматизированных информационных систем, мы еще менее склонны признавать и ценить интерпретирующую работу сборщиков данных, даже если эти действия создают условия возможности, при которых может осуществляться анализ данных.
Наша склонность упускать из виду разнообразный набор интерпретирующих суждений, содержащихся в каждом случае сбора данных, и, соответственно, уменьшать социальные условия, в которых создаются данные, распространяется даже там, где сбор данных кажется строго контролируемым. Действительно, гибкость в интерпретации, присущая сбору данных, была особенно хорошо описана в области естественных наук. Ученые тщательно задокументировали социотехнические процессы, с помощью которых контекст наблюдения по-разному предполагается, учитывается, забывается и реконструируется при сборе, агрегировании и использовании научных данных.
Чтобы подвести итог тому, что показывают такие исследования, приведем краткий сценарий. Давайте представим, что мы — команда научных исследователей, проводящая проект переписи населения. Чтобы определить, сколько жители нашего района перемещаются каждый день, мы собираем данные о количестве шагов и пройденном расстоянии от различных пользователей смартфонов в течение двух недель. Мы знаем, что разные телефоны дают разные результаты, поэтому мы обязательно документируем аппаратное и программное обеспечение каждого участника исследования. Мы также знаем, что походки бывают разными, поэтому мы предлагаем участникам выбрать один из трех стилей походки: плавную, упругую и полупрыгающую. Впоследствии мы разрабатываем функцию нормализации для сопоставления данных для различных устройств и походок. Наша функция выполняется довольно хорошо: На это может приходиться 80 процентов различий между телефонами. У нас есть ресурсы только для тестирования нашей функции на трех популярных моделях телефонов на базе Android, но у большинства пользователей смартфонов есть телефоны на базе Android. Конечно, мы обобщим эти ограничения в любой академической публикации, которая появится в результате нашего анализа. Мы ответственные ученые.
Однако со временем мы забываем о своем обещании. Мы постепенно забываем, что наша попытка объяснить различия между устройствами и походками была лишь частичной, а не полной. Более того, мы не до конца понимаем особенности и квалификационные требования, присущие нашему набору данных. Вполне вероятно, например, что некоторые участники испытывали трудности с выбором одного стиля походки (пружинистой или полупрыгучей?). но мы, исследователи, не предусмотрели способа выбрать несколько стилей или указать на неопределенность в выборе. Кроме того, наши представления о походке не учитывали людей с ограниченными физическими возможностями, которые могут двигаться по-другому или использовать разные виды протезов или опор. Действительно, я мог бы бесконечно рассказывать об огромном количестве решений, которые приняла наша команда по переписи перемещений при формировании этого конкретного набора данных, включая, конечно, первоначальную идею о том, что количество шагов является хорошим показателем перемещения. Подводя итог, можно сказать, что количественные данные о количестве шагов являются результатом сложного и запутанного набора интерпретационных решений, начиная с того, как мы разработали наше исследование, и заканчивая индивидуальными действиями участников, внесших свой вклад. Эмпирические исследования науки неизменно приводят к сходным выводам.
Сценарий переписи населения представляет собой типичную практику, а не плохую науку. Проблема, если таковая существует, заключается не в неаккуратных сборщиках данных; она заключается в нашей постоянной зависимости от дихотомии двух культур, в которой объективность и субъективность могут быть четко разделены, а человеческого беспорядка можно каким-то образом избежать при сборе данных, выполняемом людьми (или с помощью автоматизированных устройств, созданных людьми). Когда мы воображаем, что наборы данных с такими свойствами, как количество шагов, говорят сами за себя, мы снимаем с себя ответственность за определение того, какие свойства будут выражены в виде данных, в какой форме и с какими параметрами.
Тем не менее, несмотря на бесспорно последовательную картину, которую мы видим во всех исследованиях по сбору научных данных, желание исключить человека из данных с целью повышения объективности остается очень сильным. Неизменно это кажется этичным шагом.
Despite the undeniably consistent picture that we see across studies of scientific data collection, the desire to remove the human from the data in order to enhance objectivity remains very strong. / Несмотря на бесспорно последовательную картину, которую мы видим во всех исследованиях по сбору научных данных, желание исключить человека из данных для повышения объективности остается очень сильным.
Изменение культуры — это серьезное начинание, и культура обработки данных не является исключением. Но рассмотрение этих проблем в первую очередь как культурных может помочь раскрыть воображение. Когда я преподаю организацию информации студентам магистратуры, первый проект, который я перед ними ставлю, — это разработка описательной схемы: набора спецификаций для генерации данных о некоторой группе объектов. Они могут описывать все, что захотят, — кофейные зерна, языки компьютерного программирования или мифологических зверей; это не имеет значения. Поначалу все думают, что этот проект ниже их возможностей: рутинная задача. Когда я объясняю, что весь смысл в том, чтобы относиться к описанию пейзажных картин или портативных компьютеров как к открытой дизайнерской задаче, а не как к воплощению условностей, мои студенты сомневаются. Как еще мы могли бы описать научно-фантастические фильмы, если не так, как их описывает Netflix? Как еще мы могли бы описать обезболивающее, если не так, как его описывают в аптеках?
Студенты думают, что данные — это способ описания вещей такими, какие они есть, и что в этом нет никакого искусства и уж тем более никакой моды. Они очень хотят, чтобы вещи говорили сами за себя, когда они подходят к такому проекту, как разработка схемы для описания набора вещей. Чего мои студенты парадоксальным образом не понимают в своем стремлении быть ответственными, так это того, что описывать вещи по определенным характеристикам, а не по другим просто потому, что эти характеристики поддаются исчислению, — это глубоко субъективное решение.
Я живо помню одного особенно добросовестного студента, который разработал схему для описания носков. Чтобы сохранить свои данные максимально объективными, она указала только количественно измеримые характеристики, такие как толщина в миллиметрах, окружность отверстия для лодыжки и точный состав материалов. Она избегала всего, что имело видимость человеческого суждения, например, как носки могут ощущаться на человеческой коже, к какой одежде они могли бы дополнять или насколько они стильны. Но были ли ее данные объективными? Нисколько. Окружность отверстия для лодыжки? Это один из самых субъективных элементов данных, которые я только мог себе представить. Какой бесполезный фрагмент данных! Он был выбран исключительно потому, что у создателя данных были личные предпочтения в отношении видимости объективности. Когда мы рассматриваем объективность и субъективность как противоположности, а не как дополнения, мы попадаем в ловушку такого рода.
Более того, это двухкультурное мышление искажает эмпирические реалии сбора данных, сложную работу по принуждению неуправляемых явлений говорить чистыми, отчетливыми, в идеале количественными фразами. Вполне вероятно, например, что разработчик схемы носка считал фактическое измерение отверстия для лодыжки в носке неквалифицированной рутиной, которую мог бы выполнить любой. Но даже простая механика измерения гибкого круга сложна. И здесь также существуют онтологические сложности. Измеряем ли мы носки как уникальные материальные ценности (для каждого носка в мире, нового или изношенного, есть измерение) или мы измеряем носки как класс эквивалентных копий (одно измерение для набора эквивалентных носков, например, определенной марки и типа)? Даже измерение носков не является бессмысленной задачей.
“Этот проект намного сложнее, чем вы думаете”, — предупреждаю я своих студентов, прежде чем они приступят к разработке своих схем. “Большинство из вас в какой-то момент впадут в отчаяние. На самом деле, именно так вы узнаете, правильно ли вы поступаете: если вы вдруг поймете, что понятия не имеете, что делаете.” Все смеются. Они потешаются надо мной. В конце концов, именно у меня есть власть; я оцениваю их.
Однако, если мне повезет, это действительно произойдет так, как я театрально предсказываю. Каждый испытывает отчаяние. Это отчаяние немного волшебное. Я дорожу этим! Это отчаяние перед неизвестной возможностью. Это отчаяние помогает моим студентам распознать в кажущемся банальным задании реальную дизайнерскую ситуацию. Это учит их тому, что данные создаются, а не находятся; и что их правильное создание требует человечности, а не объективности.
Источник: https://thereader.mitpress.mit.edu/the-myth-of-objective-data/
от Автора: Melanie Feinberg is Associate Professor in the School of Information and Library Science at the University of North Carolina at Chapel Hill. She is the author of “Everyday Adventures With Unruly Data,” from which this article is adapted. / Мелани Файнберг — адъюнкт-профессор Школы информатики и библиотечного дела Университета Северной Каролины в Чапел-Хилл. Она является автором книги “Повседневные приключения с непослушными данными”, из которой адаптирована эта статья.