Prace badawcze prowadzone w Katedrze Systemów Multimedialnych obejmują szeroki zakres zagadnień związanych z dźwiękiem, obrazem, technologiami multimedialnymi, interfejsami multimodalnymi i wieloma innymi zagadnieniami. Rozwiązania opracowane w Katedrze były prezentowane na wielu krajowych i zagranicznych wystawach, zdobywając liczne nagrody i wyróżnienia. Wiele rozwiązań uzyskało ochronę patentową w Polsce i na świecie. Wyniki prac badawczych są publikowane w czasopismach oraz prezentowane podczas konferencji naukowych.

Najważniejsze tematy prac badawczych aktualnie prowadzonych w Katedrze zestawiono poniżej.

  • Technologia studyjna:
    • rejestracja dźwięku i obrazu
    • przetwarzanie sygnałów
    • montaż i miksowanie nagrań
    • post-produkcja dźwięku i obrazu
    • systemy wirtualnej rzeczywistości
    • wielokanałowe systemy dźwięku
  • Analiza i przetwarzanie sygnałów fonicznych:
    • rekonstruowanie nagrań
    • rozpoznawanie mowy
    • synteza mowy
    • algorytmy poprawy jakości i zrozumiałości mowy
    • filtracja przestrzenna, lokalizacja źródeł dźwięku
    • wspomaganie osób z zaburzeniami słuchu i mowy
  • Analiza i przetwarzanie sygnałów wizyjnych:
    • rozpoznawanie obiektów w obrazie
    • wykrywanie i śledzenie obiektów ruchomych
    • wizyjne rozpoznawanie mowy
    • analiza obrazu z kamer ToF, termowizyjnych i podczerwieni
    • animacja komputerowa postaci
    • systemy przechwytywania ruchu (motion capture)
  • Interfejsy multimodalne człowiek-maszyna:
    • interfejsy dla osób niepełnosprawnych
    • sterowanie komputerem za pomocą śledzenia wzroku
    • sterowanie za pomocą gestów
    • sterowanie głosowe
    • analiza fal mózgowych
  • Technologie bezpieczeństwa:
    • biometryczne rozpoznawanie osób
    • weryfikacja podpisu
    • wykrywanie niebezpiecznych zdarzeń w obrazie z kamery
    • wykrywanie zdarzeń dźwiękowych
  • Systemy teleinformatyczne:
    • monitorowanie środowiska, mapy hałasu
    • multimedialne systemy telemedyczne – diagnostyka słuchu i wzroku
    • systemy monitorowania dróg i sterowania ruchem drogowym
  • Implementacje algorytmów przetwarzania danych multimedialnych
    • procesory sygnałowe (DSP)
    • moduły uruchomieniowe i systemy wbudowane (Intel Galileo, itp.)
    • platformy do obliczeń równoległych (np. GPU)
    • obliczenia superkomputerowe
  • Multimedialne zastosowania metod uczenia maszynowego
    • algorytmy sztucznej inteligencji
    • rozpoznawanie i klasyfikacja dźwięków i obrazów
  • Akustyka muzyczna
    • rozpoznawanie dźwięków i fraz muzycznych
    • ocena testów subiektywnych
    • testy odsłuchowe
    • ocena jakości głosów śpiewaczych
  • Technika nagłaśniania:
    • projektowanie akustyczne pomieszczeń
    • projektowanie systemów nagłośnieniowych
    • metody adaptacji akustycznej pomieszczeń
    • pomiary akustyczne pomieszczeń
  • Technologie mobilne:
    • diagnostyka i monitorowanie stanu zdrowia
    • nowe formy komunikowania się osób