Google дапаможа The New York Times аблічбаваць пяць мiльёнаў архіўных фатаграфій

Платформа Google Cloud разам з The New York Times аблічбуе больш за пяць мільёнаў малюнкаў, якія захоўваюцца ў архівах газэты. Адсканаваную ўручную фатаграфію, а таксама інфармацыю, запісаную на яе адваротным баку, адправяць у воблачны сэрвіс для аўтаматычнага лічбавання і распазнавання тэксту і малюнкаў.

cloud.google.com

cloud.google.com

У архівах The New York Times (газета называе іх «моргам») захоўваюцца ад пяці да сямі мільёнаў здымкаў, выкарыстаных выданнем у сваіх нумарах амаль за ўвесь час свайго існавання (з сярэдзіны XIX стагоддзя).
Здымкі арганізаваны ў выглядзе бібліятэкі: у архіве ёсць каталог, з дапамогай якога можна знайсці патрэбную фатаграфію. На адваротным баку некаторых здымкаў таксама ўтрымліваецца інфармацыя аб зробленым фота і нават дадзеныя аб тым, у якім нумары газеты яна з'явілася.


Нягледзячы на ​​тое, што каталог дазваляе досыць хутка знайсці патрэбны здымак, гэта не вельмі зручна, асабліва — для тых, у каго няма прамога доступу да архіваў газеты. Для гэтага выданне вырашыла аблічбаваць архіўныя выявы з прыцягненнем воблачнага сэрвісу Google Cloud: акрамя сканавання саміх фотаздымкаў сістэма таксама распазнае дадатковую інфармацыю, якая можа быць запісаная на адваротным баку здымка, паведамляе hromadske.ua са спасылкай на Google. Для аблічбоўкі здымкаў выкарыстоўваць адкрытыя алгарытмы Cloud Vision API, які выкарыстоўваецца для распазнання малюнкаў.