11 май 2020

Google Cloud Video Intelligence API - Вашите видеоклипове по-откриваеми

2596

В новата ни статия от поредицата за Google Cloud APIs ще споделим информация за Cloud Video Intelligence API и как да оптимизирате своите видео клипове. Ще поговорим за неговите характеристики и възможности и как ще се развива и в бъдеще.

Тук можете да си припомните статията ни за Google Cloud Talent Solution - AI за търсене и откриване на работа, с помощта на изкуствения интелект. Инструмент, който в бъдеще ще набира все по-голяма популярност и по-широко приложение.

Преди нея пък ви разказахме малко повече за това как функционира и как може в бъдеще да се прилага Google Cloud Natural Language API за SEO.

Последно в блога пък публикувахме статията, свързана с Google Cloud Vision API - Анализ на изображения - мощен “инструмент”, който може да ви даде безкрайни възможности за приложение, особено в комбинация с библиотеките на Python.

Съдържание:

1. Какво представлява Google Cloud Video Intelligence API

2. Приложение

3. Ценообразуване

4. Как да активираме Cloud Vision API

5. Заключение

Какво представлява Google Cloud Video Intelligence API

Video Intelligence API предлага предварително обучени модели за машинно обучение, които разпознават огромен брой обекти, сцени и действия във видео. В последните му актуализации то може да открива, проследява и разпознава лога на популярни брандове и организации.

Основните му функционалности се състоят в следното:

Прецизен видео анализ - разпознава повече от 20 000 обекта, места и действия във видео. Също така, отличава промените на сцената и извлича богати данни на ниво видео или кадър.
Откриване на промени в кадъра - има възможност за откриване на промени в кадъра или в целия видеоклип. Допълнителна документация тук.
Откриване и проследяване на обекти - може да проследява къде и колко обекта има в конкретното видео.
Откриване и извличане на текст - може да се открива и извлича текст с помощта на OCR. Допълнителна информация тук
Класифициране на съдържание - разпознава съдържанието в самия видеоклип (дали е за възрастни, съдържа ли насилие и т.н). Допълнителна информация тук.
Видео транскрипция и субтитри - има възможност за записване на текст от аудиото във видеоклипа. Има възможност за филтрация на думи (например нецензурни думи) и много други. Допълнителна документация тук.
Разпознаване на знаменитости - идентифицира и проследява лицата на знаменитости във видеоклипове. Документация тук.

Можете да изгледате и видеото от официалното му представяне от конференцията на Google Cloud Next през 2017г.

Можете да разгледате и демонстрация на работата на API-то тук

2. Приложение

Приложението му все още е доста ограничено. Една от най-известните клиентски компании, която използва възможностите на API-то, е CBS Interactive.

Основните му приложения са:

Модериране на съдържанието - може да се определя кога да не се показва неподходящо съдържание в даден видеоклип. Може да се извършва модерация на цялото съдържание, както и филтрация на всичко свързано в конкретния видеоклип.

Създаването на препоръчително съдържание - може да се изгради механизъм за съдържание с етикети, генерирани от Video Intelligence API, спрямо история на гледане и предпочитания на потребителя. Това ще опрости откриването на съдържание от потребителите и ще ги насочи към най-подходящото съдържание, което представлява интерес за тях.

Медийни архиви - можете да създадете архив с всички мета данни от Video Intelligence API. То може да анализира автоматично съдържанието и да направи резултатите достъпни веднага чрез API-то.

Контекстуални реклами - може да се идентифицират подходящи местоположения във видеоклипове, за да се позиционират реклами, които са подходящи за видео съдържанието. Това може да се направи чрез съпоставяне на етикетите на вашето видео съдържание със съдържанието на вашите реклами.

Ценообразуване

Естествено, както и при предишните ML API-та на Google, така и тук, има конкретни цени при използването на различните функционалности. Цените са за минути на месечна база.

Например, ако използвате Label Detection 1400 минути, то първите 1000 минути са безплатни. Допълнителните 400 минути струват 0.10$, следователно ще трябва да заплатите само около 40$.

Как да активираме Cloud Vision API

Преди да започнете да използвате API-то на Cloud Vision, трябва да го активирате за вашия проект в Google Cloud платформата:

1. Изберете вашия проект или създайте нов тук.

2. Добавете валиден метод за таксуване във вашия Google Cloud акаунт. Допълнителна информация тук.

3. Активирайте API на Cloud Video Intelligence тук.

4. Настройте си удостоверяване.

В Cloud конзолата, отидете на Create service account key страницата тук.

От Service account менюто изберете New service account.

След това въведете някакво име (нещо, което ще е разпознаваемо) в Service account name полето, а от Role менюто изберете ProjectOwner.

Накрая кликнете върху създаването на .JSON файла, който ще съдържа вашите ключове на съответния компютър.

Video Intelligence API осигурява поддръжка за широк спектър от езици като Go, C#, Java, PHP, Node.js, Python, Ruby.

Заключение

Приложението на това API все още не е много голямо и се използва само от компании със специфични изисквания. Факт е, че това е платформа, която ще се развива още много с времето, и ще ни изненадва с интересни функционалности. Чисто технически имплементацията не е трудна, но все пак се изискват и добри програмни умения по различните езици. Ние продължаваме да следим развитието на ML API-тата на Google и ще споделяме всички новости около тях с вас.

Допълнителни източници на информация, които може да използвате:

До нови срещи със следващата ни статия от поредицата, в която ще разгледаме всичко за "Google Cloud Speech-to-Text API".

Martin Zhelyazkov

Мартин Желязков е SEO специалист в Netpeak Bulgaria Digital Growth Partner. Притежава над 10 години опит в SEO оптимизацията на онлайн магазини и корпоративни сайтове.

Фокусът на работата му в Netpeak e насочен към оптимизацията, развитието и постигането на резултати по ключови показатели за едни от най-големите дигитални бизнеси в България. Има интерес към Big Data и Machine learning, а в свободното си време пише публикации на SEO тематика и дигитален маркетинг.

Дългогодишен лектор в Softuni Digital в курсовете Search Engine Optimization, SEO Advanced и Conversion Rate Optimization, лектор на ежегодния IAB Advanced SEO masterclass, лектор на Online Advertising конференция и др.

Други статии на автора

(3.83 от 5 въз основа на 18 оценки)

Открихте грешка? Маркирайте я и натиснете Ctrl + Enter.

Препоръчани нови статии

Как един транзакционен имейл донесе средно 8% допълнителни приходи: case study за Revita.bg

Как да подготвите уебсайта си за бъдещето на AI: въведение в llm.txt и AI meta таговете

5 стъпки за създаване на впечатляващи банери с помощта на Canva и ChatGPT