Vẫy tay ra hiệu, máy tính sẽ răm rắp thực hiện theo ý bạn, không cần dùng chuột hay bàn phím, thậm chí không cần đụng đến màn hình.
Chúng ta rất quen làm việc với máy tính thông qua “công cụ” bàn phím và chuột. Với tiến bộ công nghệ đáng kinh ngạc đã tạo nên những cách tương tác mới giữa người và máy, nổi bật như màn hình chạm (như iPhone, iPad) và cử động (như Nintendo Wii), rồi đến công nghệ điều khiển bằng giọng nói (như Siri). Nhiều thiết bị “thông minh” hiện nay còn cho phép người dùng “nhập” văn bản trực tiếp bằng cách đọc (nhờ phần mềm nhận dạng giọng nói). Để việc tương tác người-máy ngày càng tự nhiên và thoải mái, người ta đã phát triển các công nghệ cho phép sử dụng cử chỉ để điều khiển máy tính và các thiết bị số khác.
THÔNG ĐIỆP CỦA CỬ CHỈ
Cử chỉ - ngôn ngữ của cơ thể thông tin về thái độ của người điều khiển, là công cụ giao tiếp hiệu quả, có thể cung cấp thông tin cần thiết để điều khiển hoặc cung cấp “dữ liệu đầu vào” cho thiết bị.
Ví dụ: cử chỉ ra hiệu “dừng!” có thể thực hiện với một tay giơ lên và lòng bàn tay hướng về phía trước, vẫy ngang hai tay trên đầu yêu cầu ngắt ngang, gật đầu để thông tin về sự chấp thuận, hay vai rũ xuống thể hiện sự buồn phiền…
Với máy tính, “hiệu lệnh” của cử chỉ có thể được nhận dạng theo các kiểu sau:
• Định trước: xác định rõ một cử chỉ để định trước tác vụ điều khiển. Ví dụ điều khiển bật/tắt đèn: khi phát hiện tay tiến về phía công tắc, đèn sẽ được bật lên; nếu phát hiện tay tiếp cận công tắc lần nữa, đèn sẽ được tắt.
• Liên hệ chức năng: sử dụng cử động một bộ phận của cơ thể để liên hệ đến chức năng cần điều khiển. Ví dụ, xoay cánh tay quanh khuỷu tay để ra lệnh mở quạt.
• Trao đổi tự nhiên: sử dụng cử chỉ như trong giao tiếp giữa người với người để gửi hiệu lệnh đến thiết bị. Ví dụ nếu bạn quạt tay trước mặt (thông điệp: “nóng”), thiết bị nhận dạng cử chỉ này và hạ nhiệt độ máy lạnh xuống.
NHẬN DẠNG CỬ CHỈ
Trong giao tiếp giữa người với người, chúng ta chỉ dựa vào quan sát để nhận biết ngôn ngữ cơ thể. Nhưng với máy tính, có nhiều cách để “nhìn” hay nhận dạng cử chỉ.
• Chuột (mouse) có lẽ là công cụ nhận dạng cử chỉ đầu tiên trong lĩnh vực tương tác người và máy tính: chuyển động tay tới/lui hay qua trái/phải được ghi nhận để di chuyển con trỏ tương ứng trên màn hình.
• Miếng chạm (touchpad) có chức năng giống như chuột, nhưng trên máy tính xách tay ghi nhận sự di chuyển của tay bằng cảm ứng thay vì chuyển động cơ hay quang ở chuột.
• Màn hình cảm ứng chạm là một bước đột phá, có thể nhận biết nhiều “tổ hợp” cử chỉ phức tạp, tạo sự đa dạng và linh hoạt hơn khi tương tác với máy tính. Điều khiển với màn hình chạm hiện được sử dụng cho nhiều loại thiết bị như điện thoại di động, máy tính bảng, máy ATM …
Cũng có những giải pháp kỹ thuật cho phép máy tính nhận dạng cử chỉ “cách không” (người điều khiển không đụng đến máy tính hay màn hình).
Trước hết phải kể đến găng tay có cảm biến. Các cảm biến được sử dụng để cung cấp thông tin về vị trí, hướng của bàn tay và cử động của các ngón tay. Đây là công cụ mà Tom Cruise sử dụng để “múa tay” điều khiển các đối tượng trên màn hình trong bộ phim nổi tiếng Minority Report. Găng tay điều khiển thương mại đầu tiên của hãng DataGlove có gắn các sợi cáp quang mỏng chạy phía sau lưng bàn tay, mỗi sợi có một khe nhỏ. Ánh sáng được chiếu trong sợi cáp, khi các ngón tay co lại sẽ làm rò rỉ ánh sáng qua khe và thông tin này được ghi nhận để xác định tư thế của tay.
Một kỹ thuật khác là dùng bộ phát siêu âm đeo ở ngón trỏ và bộ thu (có khả năng theo dõi vị trí của bộ phát) gắn trên thiết bị cần điều khiển. Bộ phận nghiên cứu của hãng phần mềm Microsoft vừa giới thiệu ứng dụng SoundWave sử dụng loa và micro thông thường (có thể là loại tích hợp có sẵn trên máy tính xách tay) để nhận dạng cử chỉ dựa trên hiệu ứng Droppler.
Kỹ thuật quan sát dùng camera có lẽ là giải pháp “thoải mái” nhất cho người dùng. Có giải pháp dùng camera chuyên dụng nhận biết chiều sâu, có giải pháp dùng hai camera, cũng có giải pháp dùng một camera thông thường (như giải pháp của Flutter). Có hai cách nhận dạng cử chỉ dựa trên kỹ thuật quan sát:
• Dựa trên mô hình: lập mô hình tập hợp các cử chỉ mẫu và nhận dạng khi có cử chỉ trùng.
• Dựa trên hình ảnh: ghi nhận hình ảnh chuyển động trong suốt quá trình của cử chỉ để nhận dạng.
ỨNG DỤNG ĐA DẠNG
Ban đầu, “tín hiệu cử chỉ” chỉ dùng để điều khiển máy tính, cải thiện việc tương tác giữa người và máy tính. Nhưng với sự phổ biến của các thiết bị thông minh, nhiều hoạt động đời thường hiện giờ cũng sử dụng kỹ thuật điều khiển bằng cử chỉ.
Ví dụ như xem tivi. Người dùng có thể dùng tay ra lệnh bật/tắt tivi, thay đổi kênh, tăng/giảm âm lượng và làm nhiều thứ khác. Với những chiếc tivi thông minh đời mới có khả năng chơi game và lướt web, việc điều khiển bằng cử chỉ thoải mái hơn hẳn chiếc remote. Và còn một điều không kém quan trọng: bạn không phải thay pin!
Kỹ thuật điều khiển bằng cử chỉ cũng đã được sử dụng cho các thiết bị chơi game thế hệ mới như Microsoft XBox, Sony PS3. Với XBox, người chơi thường sử dụng bộ điều khiển nhiều nhất và thực hiện tất cả chuyển động mà họ muốn nhân vật trong trò chơi thực hiện, điều này đồng nghĩa với việc người chơi được hóa thân vào nhân vật. Ví dụ, họ phải giả vờ đá quả bóng trong trò chơi bóng đá. XBox thế hệ mới sử dụng cảm biến Kinect có camera giám sát các chuyển động và xử lý để nhân vật thực hiện giống y như vậy.
Những người khiếm thị hoặc có vấn đề về cơ bắp có thể nhờ đến sự giúp đỡ của thiết bị điều khiển dựa trên cử chỉ. Hiện đã có những chiếc xe lăn dùng máy điều khiển bằng cử chỉ. Người dùng chỉ cần di chuyển bàn tay một chút trên bảng điều khiển đặt ở thanh vịn của xe. Chuyển động của bàn tay sẽ hoạt động như công cụ điều khiển và có thể dễ dàng kiểm soát tốc độ cũng như hướng đi của xe.
Ngoài ra, kỹ thuật điều khiển bằng cử chỉ còn được sử dụng trong các lĩnh vực đặc biệt như điều khiển không lưu, điều khiển cần cẩu, huấn luyện trong thể thao, phẫu thuật trong y tế…
Việc điều khiển bằng cử chỉ không hẳn sẽ thay thế hoàn toàn các “thiết bị nhập” như bàn phím hay màn hình cảm ứng; và không phải luôn có thể sử dụng. Không có giải pháp nào là tốt cho tất cả. Nhưng kết hợp nhiều “kênh giao tiếp”, việc tương tác giữa người và máy sẽ “uyển chuyển” và hiệu quả hơn.
P.Nguyễn, STINFO Số 8/2012.