Film z Youtube jako źródło mapy

Film z Youtube jako źródło mapy

Jak wydobyć lokalizacje o których ktoś opowiada w filmie na YouTube? Do niedawna, trzeba było obejrzeć film, spisać lokalizacje a później poszukać ich w sieci internetowej. Odkąd jednak sztuczna inteligencja zaczęła wyskakiwać z lodówki i z geolokalizacją filmów możemy poradzić sobie z jej użyciem.

YouTube, który za dwa tygodnie będzie obchodził 20-lecie urodzin, przez lata zyskał status jednej z największych wyszukiwarek na świecie. Wyszukiwarki charakterystycznej, bo funkcjonującej w oparciu o treści audio-wideo. Poza setkami tysięcy godzin materiałów o wyjątkowo wątpliwej jakości jest także źródłem treści edukacyjnych, a także ciekawym miejscem szukania inspiracji dla ludzi szukających ciekawych miejsc do odwiedzenia (dzięki vlogom, filmom podróżniczym dokumentalnym czy zapisu wycieczek realizowanych przez prywatnych turystów).

Ręczne zapisywanie lokalizacji wspomnianych w filmie może być czasochłonne i nieefektywne. A co gdyby istniał łatwiejszy sposób na automatyczne wyodrębnianie i mapowanie tych lokalizacji?

Transkrybuj i geolokalizuj

Najprostszym rozwiązaniem jest wykonanie dwóch kroków:

  1. Transkrypcja filmu
  2. Wyodrębnienie nazw własnych i ich geolokalizacja

Okazuje się, że istnieje już darmowe narzędzie online, które radzi sobie z takim zagadnieniem. AllStara Video AI, bo o nim mowa oferuje kilka funkcji do analizy i wyodrębniania informacji z filmów na YouTube. Jedną z dostępnych opcji jest Video Locations Mapper, którego celem jest „wyodrębnianie lokalizacji z filmu i zapisywanie ich jako mapy do planowania podróży”.

Korzystanie z narzędzia jest proste – wystarczy wprowadzić adres URL filmu na YouTube i nacisnąć przycisk „Start Extract Location” („Rozpocznij wyodrębnianie lokalizacji”).

Przetestowałem go podając adres do kilkuminutowego filmu z przeglądem pięciu lokali z sprzedających croisanty w Paryżu. Zabawnego swoją drogą przez kontrast z wydarzeniami w tle.

Aplikacja wygenerowała plik w formacie JSON zawierający wszystkie lokalizacje wymienione w filmie.

Aplikacja zwróciła także link do mapy opartej na Leaflet.js. z wyodrębnionymi lokalizacjami:

Jest mapa, ale ja chcę danych GIS

W efekcie przetworzenia aplikacja zwraca JSON, który z kolei możemy wykorzystać do poszukania współrzędnych. A jakże tu też wykorzystamy nasz mityczny AI. Do tego celu wykorzystam ChatGPT od OpenAI oraz „jeszcze ciepły” Deepseek.

W obu przypadkach użyłem prompta:

„Extract all the locations mentioned in this video transcript (all should be in Paris) and then create a GeoJSON file with all the locations. {video transcription}”

Wersja po polsku:

„Wyodrębnij wszystkie lokalizacje wymienione w transkrypcji tego filmu (wszystkie powinny znajdować się w Paryżu), a następnie utwórz plik GeoJSON ze wszystkimi lokalizacjami.  { transkrypcja wideo}

W obu przypadkach aplikacje zwróciły poprawne pliki GEOJSON (niemal identyczne w formie – różniły się kolejnością zwracanych atrybutów).

Mam dane GIS, chcę je zwizualizować

Wygenerowane pliki otworzyły się bez najmniejszych błędów zarówno w QGIS jak i w aplikacji geojson.io. W pierwszym przypadku wystarczyło przeciągnąć do okna programu wygenerowany plik o rozszerzeniu GeoJSON. Po lekkiej stylizacji i dodaniu mapy bazowej dane wyglądają tak:

W przypadku drugiej aplikacji wystarczyło wkleić zawartość GeoJSON do okienka po prawej stronie ekranu. Efekt jest podobny:

Tytułem podsumowania

Aplikacja AllStara Video AI w prostym zastosowaniu zadziałała bez przeszkód. Trzeba było chwilę zaczekać, ale efekt spełnił wszelkie kryteria. Nie testowałem jej przy większych i bardziej skomplikowanych językowo filmach.

Zaskoczeniem jest za to odpowiedź chatów. Oba dały poprawą odpowiedź jeśli chodzi o lokalizacje. Jednak to odpowiedź DeepSeek zwróciła moją uwagę. Chińska aplikacja w ramach uzupełnienia informacji dodała taką oto adnotację:

Cédric Grolet Opéra: Although the exact address isn't mentioned in the transcript, it is inferred to be at 35 Avenue de l'Opéra, 75002 Paris, France, based on its name and location near the Opéra.
The coordinates are approximate and based on the addresses provided. You can refine them further using a geocoding service if needed.

Po polsku:

Cédric Grolet Opéra: Chociaż dokładny adres nie został podany w transkrypcji, można wywnioskować, że znajduje się on pod adresem 35 Avenue de l'Opéra, 75002 Paris, Francja, w oparciu o jego nazwę i lokalizację w pobliżu opery.
Współrzędne są przybliżone i oparte na podanych adresach. W razie potrzeby można je doprecyzować za pomocą usługi geokodowania.