ChatGPT, zaawansowany model językowy opracowany przez OpenAI, wprowadził nową funkcję, która umożliwia użytkownikom korzystanie z kamery smartfona w zaawansowanym trybie głosowym. Dzięki temu ChatGPT może „widzieć” to, co widzi użytkownik co pozwala na jeszcze większą interakcję z otoczeniem.
Co prawda funkcja była już dostępna w większości krajów od grudnia 2024 – jednak jak to zwykle bywa, dzięki Unijnym regulacjom musieliśmy na nią poczekać aż do dzisiaj.

Jak działa funkcja kamery w ChatGPT?
Po aktywacji zaawansowanego trybu głosowego użytkownicy mogą włączyć kamerę swojego telefonu. ChatGPT jest w stanie odpowiadać na pytania dotyczące obiektów znajdujących się w polu widzenia kamery.
Funkcja ta jest dostępna dla subskrybentów planów Plus i Pro oraz dla użytkowników zespołowych.
Ale jakie może być jej zastosowanie?
Prosty przykład: Użytkownik może skierować kamerę smartfona na nieznaną roślinę lub zwierzę i zapytać ChatGPT o jego nazwę oraz charakterystykę. Sztuczna inteligencja przeanalizuje obraz, zidentyfikuje gatunek i dostarczy informacji na temat jego cech, środowiska naturalnego czy ciekawostek.
Praktyczne zastosowania funkcji kamery w ChatGPT
- Tłumaczenie tekstu w czasie rzeczywistym – Użytkownik może skierować kamerę na napis w obcym języku, a ChatGPT poda jego tłumaczenie oraz dodatkowe informacje o znaczeniu słów.
- Rozpoznawanie produktów spożywczych – Skierowanie kamery na produkt w sklepie może dostarczyć informacji o jego składnikach, wartości odżywczej czy potencjalnych alergenach.
- Pomoc w naprawach i montowaniu przedmiotów – ChatGPT może podpowiedzieć, jak naprawić dany sprzęt lub poprawnie zmontować mebel, analizując jego wygląd.
- Identyfikacja dzieł sztuki i zabytków – Użytkownik może zeskanować obraz lub posąg, a ChatGPT poda jego historię oraz znaczenie w kulturze.