ChatGPT teraz widzi to, co Ty: funkcja kamery w trybie głosowym

ChatGPT, zaawansowany model językowy opracowany przez OpenAI, wprowadził nową funkcję, która umożliwia użytkownikom korzystanie z kamery smartfona w zaawansowanym trybie głosowym. Dzięki temu ChatGPT może „widzieć” to, co widzi użytkownik co pozwala na jeszcze większą interakcję z otoczeniem.

Co prawda funkcja była już dostępna w większości krajów od grudnia 2024 – jednak jak to zwykle bywa, dzięki Unijnym regulacjom musieliśmy na nią poczekać aż do dzisiaj.

Jak działa funkcja kamery w ChatGPT?

Po aktywacji zaawansowanego trybu głosowego użytkownicy mogą włączyć kamerę swojego telefonu. ChatGPT jest w stanie odpowiadać na pytania dotyczące obiektów znajdujących się w polu widzenia kamery.

Funkcja ta jest dostępna dla subskrybentów planów Plus i Pro oraz dla użytkowników zespołowych.

Ale jakie może być jej zastosowanie?

Prosty przykład: Użytkownik może skierować kamerę smartfona na nieznaną roślinę lub zwierzę i zapytać ChatGPT o jego nazwę oraz charakterystykę. Sztuczna inteligencja przeanalizuje obraz, zidentyfikuje gatunek i dostarczy informacji na temat jego cech, środowiska naturalnego czy ciekawostek.

Praktyczne zastosowania funkcji kamery w ChatGPT

Tłumaczenie tekstu w czasie rzeczywistym – Użytkownik może skierować kamerę na napis w obcym języku, a ChatGPT poda jego tłumaczenie oraz dodatkowe informacje o znaczeniu słów.
Rozpoznawanie produktów spożywczych – Skierowanie kamery na produkt w sklepie może dostarczyć informacji o jego składnikach, wartości odżywczej czy potencjalnych alergenach.
Pomoc w naprawach i montowaniu przedmiotów – ChatGPT może podpowiedzieć, jak naprawić dany sprzęt lub poprawnie zmontować mebel, analizując jego wygląd.
Identyfikacja dzieł sztuki i zabytków – Użytkownik może zeskanować obraz lub posąg, a ChatGPT poda jego historię oraz znaczenie w kulturze.