Чи вірить люди алгоритми більше, ніж реалізують компанії?

WESTEND61/GETTY IMAGES

Багато компаній вискочили на “великі дані” перемоги.  Вони залучають вчених-дослідників даних, виводять співробітників та користувачів даних для розуміння та створюють алгоритми для оптимізації їхніх рекомендацій. Тим не менше, ці ж компанії часто припускають, що клієнти стурбовані своїми алгоритмами, і вони йдуть на велику довжину, щоб приховати або гуманізувати їх.

Наприклад, компанія Stitch Fix, служба онлайн-підписки на покупки, яка поєднує в собі людське та алгоритмічне рішення, підкреслює людський відтінок їх послуг у їхньому маркетингу. Веб-сайт пояснює, що для кожного клієнта стиліст буде купувати 5 шт [одягу]. Це стосується його послуг як “вашого партнера в особистому стилі” та “вашого нового особистого стиліста” і описує його рекомендації як “персоналізовані” (personalized) та “відсортований вручну” (handpicked).  Для того, щоб поповнити це, нотатка зі свого стиліста супроводжує кожну партію одягу. Ніде на веб-сайті ви можете знайти термін “керований даними”, навіть якщо Stitch Fix відомий своїм підходом до даних, і його часто називають “Netflix of fashion”.

Схоже, що більше компаній очікують, що користувачі будуть займатися їх продуктом чи служби, тим більше вони антропоморфізують свої алгоритми. Подумайте, як компанії називають своїх віртуальних помічників, як Siri та Alexa. І як творці Джибо, “перший у світі соціальний робот”, створили бездоганно привабливий шматочок пластику, який сміється, співає, має милий моргаючий око і рухається таким чином, що імітує танці.

Але чи є це хороша практика для компаній маскувати свої алгоритми таким чином? Чи маркетингові долари добре витратили на створення назв для Alexa та особових рис для Jibo? Чому ми так впевнені, що люди відкладають алгоритми та їхні поради? Наше недавнє дослідження допитувало це припущення.

Потужність алгоритмів

Спочатку трохи тла. З 1950-х рр. Дослідники задокументували численні типи прогнозів, в яких алгоритми перевершують людей. Алгоритми перемагають лікарів та патологів у прогнозуванні виживання хворих на рак, виникнення серцевих нападів та тяжкості захворювань. Алгоритми передбачають рецидив паролів краще, ніж паролі. І вони прогнозують, чи буде бізнес збанкрутувати краще, ніж позичальники.

Згідно з анекдотами в класичній книзі про точність алгоритмів, багато з цих ранніх висновків були сприйняті скептицизмом. Фахівці 1950-х років не хотіли вірити, що простий математичний розрахунок може перевершити власне професійне судження. Цей скептицизм зберігався і перетворився на отриману мудрість, що люди не довірятимуть і не користуються порадами з алгоритму. Ось одна з причин того, чому так багато статей сьогодні все-таки радять бізнес-лідерам про те, як подолати неприйняття до алгоритмів.

Чи бачимо сьогодні недовіру до алгоритмів?

У нашому недавньому дослідженні ми виявили, що люди не люблять алгоритми так само, як попередня стипендія може нас повірити. Фактично, люди демонструють “оцінку алгоритму” і більше покладаються на ту ж саму пораду, коли думають, що це походить від алгоритмічної людини. Через шість досліджень ми попросили репрезентативних зразків 1260 онлайн-учасників у США, щоб зробити різні прогнози. Наприклад, ми попросили деяких людей прогнозувати появу ділових та геополітичних подій (наприклад, ймовірність того, що Північна Америка чи ЄС вводять санкції проти країни в зв’язку з кіберами); ми попросили інших прогнозувати рейтинг пісень на Billboard Hot 100; і ми мали одну групу учасників грати в онлайн-сватач (вони читали профіль знайомств людини, побачили фотографію її потенційної дати і передбачали, як вона буде користуватися датою з ним).

У всіх наших дослідженнях учасникам було запропоновано зробити чисельне прогнозування, виходячи з їх найкращого уявлення.  Після їх початкової здогадки вони отримали пораду та мали можливість переглянути їх прогноз.

Наприклад, учасники відповів: “Яка ймовірність того, що Tesla Motors постачатиме більше 80 000 електромобілів, що працюють на акумуляторі (BEVs), в календарному році 2016 року?”, Набравши відсоток від 0 до 100%. Коли учасники отримали пораду, він прийшов у формі іншого передбачення, який позначався як інша особа або алгоритм.

Ми виготовили числову пораду, використовуючи просту математику, яка об’єднує декілька людських суджень.  Це дозволило нам правдиво представити таку саму пораду як “людську” або “алгоритмічну”. Ми стимулювали учасників переглянути свої прогнози – чим ближче їх прогноз до фактичної відповіді, тим більші шанси отримати грошову премію.

Потім ми виміряли, скільки людей змінили свою оцінку після отримання поради. Для кожного учасника ми взяли відсоток від 0% до 100%, щоб відобразити, наскільки вони змінили свою оцінку з їх початкового уявлення.  Зокрема, 0% означають, що вони повністю ігнорують пораду та прив’язані до своєї початкової оцінки, 50% означають, що вони змінюються д їх оцінка на півдорозі до поради, і 100% означає, що ці поради повністю узгоджені.

На наш подив, ми виявили, що люди більше спиралися на ту ж саму пораду, коли думали, що це походить від алгоритму, ніж від інших людей. Ці результати були послідовні в наших дослідженнях, незалежно від різних типів чисельних прогнозів. Особливо цікавим цей алгоритм оцінили, оскільки ми не надали багато інформації про алгоритм.

Ми запропонували алгоритмічні рекомендації таким чином, оскільки алгоритми регулярно з’являються в повсякденному житті без опису (так звані “алгоритми чорного ящику”); більшість людей не піддаються внутрішнім роботам алгоритмів, які передбачають що впливають на них речі (наприклад, погода або економіка).

Ми запитали, чи були наші результати створені завдяки зростанню знайомств людей з алгоритмами сьогодні. Якщо це так, вік може призвести до відкритості людей до алгоритмічної поради. Натомість ми виявили, що вік наших учасників не впливає на їх готовність покладатися на алгоритм. У наших дослідженнях літні люди використовували алгоритмічні поради так само, як і молодші люди.

Що важливо було, наскільки зручними були учасники з числами, які ми виміряли, попросивши їх прийняти тест на балансування з 11 питань. Чим більше учасників нашого номера (тобто, чим більше математичних питань вони правильно відповідали на тестування з 11 елементами), тим більше вони слухали алгоритмічну пораду.

Далі ми хотіли перевірити, чи існує сьогодні ідея про те, що люди не довіряють алгоритмам – і чи будуть сучасні дослідники все-таки передбачати, що люди не будуть любити алгоритми. У додатковому дослідженні ми запросили 119 дослідників, які вивчають судження людини, щоб передбачити, скільки учасників слухатимуть пораду, коли мова йде про людину або алгоритм.

Ми надали дослідникам ті самі матеріали досліджень, які наші учасники бачили під час вивчення сватача. Ці дослідники, відповідно до того, що передбачали багато компаній, передбачали, що люди будуть демонструвати відраза до алгоритмів і більше довірятимуть людським порадам – ​​протилежність нашим фактичним висновкам.

Нам також цікавило, чи може експертиза засновників, які приймають рішення, впливати на алгоритмічну оцінку. & Nbsp; Ми набрали окремий зразок 70 фахівців з національної безпеки, які працюють у уряді США. Ці фахівці є експертами з прогнозування, тому що вони регулярно проводять прогнози. Ми попросили їх передбачити різні геополітичні та ділові заходи, а також додаткові зразки не експертів (301 онлайн-учасника). Те саме. Як і в наших інших дослідженнях, обидві групи зробили прогноз, отримали поради, позначені як людськими або алгоритмічними, а потім отримали можливість переглянути їх прогноз, щоб зробити остаточну оцінку. Їx було поінформовано, що чим точніше їх відповіді, тим краще їхні шанси на виграш призу. Не-експерти діяли як наші попередні учасники – вони більше спиралися на таку ж пораду, коли думали, що це походить від алгоритму, ніж людина для кожного з прогнозів.

Однак експерти враховували як поради від алгоритму, так і поради від людей.  Здавалося, вони найбільше довіряють власному досвіду та мінімально переглядали свої оригінальні прогнози. Нам потрібно було чекати близько року, щоб забити точність прогнозів, виходячи з того, чи дійсно ця подія дійсно відбулася, чи ні. Ми виявили, що експерти та не експерти робили аналогічні точні прогнози, коли вони отримували поради від людей, тому що вони однаково знецінили цю пораду. Але коли вони отримали поради від алгоритму, експерти зробили менш точні прогнози, ніж не-експерти, тому що експерти не бажають слухати алгоритмічну пораду. Інакше кажучи, в той час, коли наші експерти-учасники довіряли алгоритмічним рекомендаціям, експерти з національної безпеки не зробили цього, і це коштувало їх з точки зору точності. Здавалося, що їхній досвід зробив їх особливо впевненими в їх прогнозуванні, що змусило їх більш-менш ігнорувати рішення самого алгоритму. Інше дослідження, яке ми провів, підтверджує це потенційне пояснення.

Ми перевірили, чи віра в власні знання може завадити людям цінувати алгоритми. Коли учасники мали вибирати, покладаючись на алгоритм або покладаючись на поради іншої людини, ми знову виявили, що люди віддають перевагу алгоритму. Проте, коли вони мали вибрати, чи слід покладатися на власне судження або пораду алгоритму, популярність алгоритму знизилася. Незважаючи на те, що люди задовольняють сильні сторони алгоритміки над людським судженням, їхня довіра до алгоритмів, здається, зменшується, коли порівнюють їх безпосередньо з власним судженням. Іншими словами, люди, як видається, цінують алгоритми більше, коли вони вибирають між рішенням алгоритму та іншим, ніж коли вони повторно вибираючи між рішенням алгоритму та своїм власним. Інші дослідники виявили, що контекст прийняття рішень пов’язаний з тим, як люди реагують на алгоритми.

Наприклад, в одному документі зазначено, що коли люди вважають алгоритм помилковими, вони менше схильні довіряти йому, що завдає шкоди їх точності.  Інші дослідники виявили, що люди вважають за краще отримувати жартові рекомендації від близького друга за алгоритмом, навіть якщо алгоритм робить кращу роботу. В іншому документі було встановлено, що люди менш схильні довіряти рекомендаціям з алгоритму, коли мова йде про моральні рішення про самохідні автомобілі та медицину. Наші дослідження показують, що людям часто зручно приймати рекомендації з алгоритмів, а іноді навіть довіряти їм більше, ніж інші люди.

Це не означає, що клієнти іноді не цінують “людський дотик” за продуктами та послугами; але це припускає, що може не знадобитися інвестувати в підкреслення людського елемента процесу, повністю або частково керованого алгоритмами. Фактично, чим більш деталізована артіфікація, тим більше клієнтів можуть почувати себе обманутими, коли вчилися, що вони фактично керувалися алгоритмом. Google Duplex, який закликає компанії планувати зустрічі та створювати резерви, генерував миттєвий зворотний зв’язок, оскільки це звучало як “занадто” людина, і люди почувалися обмануті. Прозорість може окупитися. Можливо, компанії, які представляють себе в першу чергу на основі алгоритмів, як Netflix і Pandora, мають правильну ідею.

автори: Jennifer M. Logg, Julia A. Minson та Don A. Moore

 

оригінальна стаття: Harvard Business Review

Leave a Reply

Your email address will not be published.