Footer

    Download on the App StoreGet it on Google Play

    Giới thiệu

    • Tìm hiểu về VoiceTube
    • Giới thiệu dịch vụ học tập
    • Tham gia cùng chúng tôi
    • Câu hỏi thường gặp
    • Chủ đề tìm kiếm hot

    Tổng quan dịch vụ

    • Sổ từ vựng và câu
    • Campus
    • Tra từ điển
    • Nhập video và tạo phụ đề

    Kênh nổi bật

    Phân cấp video

    • A1 sơ cấp
    • A2 sơ cấp
    • B1 trung cấp
    • B2 trung cao cấp
    • C1 cao cấp
    • C2 thành thạo

    Quyền riêng tư˙Điều khoản˙
    ©2026 VoiceTube Corporation. All rights reserved

    multimodal

    US

    ・

    UK

    B1 trung cấp
    adj.tính từđa phương thức
    The brain is multi-modal, it has so many interacting components

    Phụ đề video

    Google I/O '24 in under 10 minutes

    09:58Google I/O '24 in under 10 minutes
    • Unlocking knowledge across formats is why we built Gemini to be multimodal from the ground up.

      Với Gemini, bạn đang làm cho điều đó trở nên dễ dàng hơn rất nhiều.

    • is why we built Gemini to be multimodal from the ground up.
    B1 trung cấp

    9 CHIẾN LƯỢC HỌC TẬP TỐT NHẤT ĐƯỢC XẾP HẠNG | Ngừng học sai cách (9 BEST Study Strategies Ranked | Stop Studying Wrong)

    11:129 CHIẾN LƯỢC HỌC TẬP TỐT NHẤT ĐƯỢC XẾP HẠNG | Ngừng học sai cách (9 BEST Study Strategies Ranked | Stop Studying Wrong)
    • You can also create multimodal study resources yourself.

      Bạn cũng có thể tự tạo các tài liệu học tập đa phương thức.

    • You can also create multimodal study resources yourself.

      Ở vị trí thứ bảy, chúng ta có interleaving.

    B1 trung cấp

    Khi nào Trí tuệ Nhân tạo sẽ thay thế các bác sĩ X quang? 🤖 (When Will Artificial Intelligence Replace Radiologists? 🤖)

    15:49Khi nào Trí tuệ Nhân tạo sẽ thay thế các bác sĩ X quang? 🤖 (When Will Artificial Intelligence Replace Radiologists? 🤖)
    • These models are increasingly multimodal and sometimes called vision language models, or VLMs, because they can now process images and videos alongside text.

      Các mô hình này ngày càng đa phương thức và đôi khi được gọi là mô hình ngôn ngữ thị giác, hay VLM, vì chúng có thể xử lý hình ảnh và video cùng với văn bản.

    • These models are increasingly multimodal and sometimes called vision language models or VLMs because they can now process images and videos alongside text.

      Một nghiên cứu về hình ảnh nhi khoa cho thấy các mô hình này chỉ chẩn đoán đúng 27,8% trường hợp và một nghiên cứu khác báo cáo độ chính xác dưới 50%.

    B1 trung cấp

    Kỷ nguyên mới của trí tuệ với Gemini 3 (A new era of intelligence with Gemini 3)

    01:57Kỷ nguyên mới của trí tuệ với Gemini 3 (A new era of intelligence with Gemini 3)
    • Gemini has been multimodal since the beginning.

      Gemini đã đa phương thức ngay từ đầu.

    • Gemini has been multimodal since the beginning.

      Gemini đã đa phương thức ngay từ đầu.

    B1 trung cấp

    8 Chuyên khoa Sâu Gây Mê Được Giải Thích 💉 Bạn Có Nên Chuyên Sâu? (8 Anesthesia Subspecialties Explained 💉 Should You Specialize?)

    13:318 Chuyên khoa Sâu Gây Mê Được Giải Thích 💉 Bạn Có Nên Chuyên Sâu? (8 Anesthesia Subspecialties Explained 💉 Should You Specialize?)
    • You'll also gain skills in acute pain consults, multimodal analgesia, and opioid sparing protocols.

      Bạn cũng sẽ được trang bị kỹ năng trong việc tư vấn về đau cấp tính, giảm đau đa mô thức và các phác đồ tiết kiệm opioid.

    • You'll also gain skills in acute pain consults, multimodal analgesia, and opioid-sparing protocols.

      Bạn sẽ thành thạo việc theo dõi thần kinh sinh lý, các chiến lược tưới máu não và kiểm soát huyết động chặt chẽ.

    B2 trung cao cấp

    Sự kiện Chip AI Lunar Lake của Intel: Mọi thứ được tiết lộ trong 10 phút (Intel's Lunar Lake AI Chip Event: Everything Revealed in 10 Minutes)

    09:46Sự kiện Chip AI Lunar Lake của Intel: Mọi thứ được tiết lộ trong 10 phút (Intel's Lunar Lake AI Chip Event: Everything Revealed in 10 Minutes)
    • So you can see a typical LLM, we're getting the text answer here, standard, but it's a multimodal LLM.
    • We're getting the text answer here, standard, but it's a multimodal LLM.

      Chúng ta nhận được câu trả lời văn bản ở đây, tiêu chuẩn, nhưng đây là một LLM đa phương thức.

    B2 trung cao cấp

    Seedance 2.0 Tuyệt Vời Như Thế Nào (Và Tại Sao Hollywood Lại Lo Sợ) (How Seedance 2.0 is SO GOOD (And Why Hollywood is Shook))

    10:39Seedance 2.0 Tuyệt Vời Như Thế Nào (Và Tại Sao Hollywood Lại Lo Sợ) (How Seedance 2.0 is SO GOOD (And Why Hollywood is Shook))
    • And that's where we do have some insights into how this model works, uh, as they describe it as a unified multimodal generation model endowed with deep thinking and online search capabilities.

      Vậy đây là một video model có khả năng suy nghĩ, bạn hãy dừng lại một chút về điều này.

    • And that's where we do have some insights into how this model works, as they describe it as a unified multimodal generation model endowed with deep thinking and online search capabilities.

      Và đó là nơi chúng ta có một số hiểu biết về cách model này hoạt động, vì họ mô tả nó là một mô hình tạo sinh đa phương thức thống nhất được trang bị khả năng suy nghĩ sâu và tìm kiếm trực tuyến.

    B1 trung cấp

    Chúng tôi thử nghiệm GPT Image 1.5 và Nano Banana Pro với tốc độ Gemini 3 Flash (We test GPT Image 1.5 vs Nano Banana Pro with Gemini 3 Flash speed)

    06:52Chúng tôi thử nghiệm GPT Image 1.5 và Nano Banana Pro với tốc độ Gemini 3 Flash (We test GPT Image 1.5 vs Nano Banana Pro with Gemini 3 Flash speed)
    • They say it's a solid match or beats uh two point five Pro on multimodal reasoning coding tool use runs up to three times faster.

      Đúng vậy, chính xác.

    • Essentially they say it's a solid match or beats 2.5 pro on multimodal reasoning coding tool use runs up to three times faster.

      Về cơ bản, họ nói rằng nó tương đương hoặc tốt hơn 2.5 pro về khả năng suy luận đa phương thức, sử dụng công cụ mã hóa, chạy nhanh hơn gấp ba lần.

    A2 sơ cấp

    Gemini 3 Đẩy Giới Hạn Hình Ảnh (Gemini 3 Pushes Visual Boundaries)

    12:43Gemini 3 Đẩy Giới Hạn Hình Ảnh (Gemini 3 Pushes Visual Boundaries)
    • Native multimodality, which when I heard that I was like, well wait a minute, aren't these systems multimodal already?

      Khả năng đa phương thức gốc, khi tôi nghe điều đó, tôi đã nghĩ, đợi đã, chẳng phải các hệ thống này đã là đa phương thức rồi sao?

    • Aren't these systems multimodal already?

      Giao diện người dùng tạo sinh, nhiều hoạt ảnh, nhiều hoạt ảnh hơn, những thứ tương tự.

    B1 trung cấp

    Nhìn hậu trường Google Gemini 3 (A Behind the Scenes Look at Google's Gemini 3)

    13:04Nhìn hậu trường Google Gemini 3 (A Behind the Scenes Look at Google's Gemini 3)
    • They wanted state-of-the-art reasoning and real nuance and depth, especially when you're talking about the multimodal stuff, which this model is very good at.

      Một trong những người sáng tạo ngồi trong phòng với chúng tôi đã hỏi họ lý do chậm trễ.

    • Especially when you're talking about the multimodal stuff, which this model is very good at.

      Đặc biệt là khi bạn nói về các khía cạnh đa phương thức, điều mà mô hình này làm rất tốt.

    B1 trung cấp