จุดขายสำคัญของเฮดเซต Vision Pro ของแอปเปิล คือการควบคุมสั่งการโดยไม่ต้องใช้อุปกรณ์เพิ่มเติม แต่ใช้การตรวจจับตำแหน่งดวงตา และการออกท่าทางของมือ (Gesture) ซึ่งในเซสชันสำหรับนักพัฒนา แอปเปิลก็ได้ลงรายละเอียดที่มากขึ้นของส่วนติดต่อผู้ใช้งานนี้
โดยรูปแบบการออกท่าทางมือพื้นฐาน มีทั้งหมด 6 รูปแบบได้แก่
ผลงานวิจัยชิ้นใหม่ของ The Engineering Human-Computer Interaction (EHCI) ช่วยให้ iPad 2 สามารถแสดงผลเป็น 3 มิติได้ โดยที่ไม่ต้องใส่แว่นตาหรือใช้จอพิเศษแบบ Nintendo 3DS เทคนิคที่ว่านี้มีชื่อว่า Head-Coupled Perspective ซึ่งใช้วิธีการเปิดกล้องที่หน้าจอเครื่องแล้วจดจำหน้าของผู้ใช้ไว้ จากนั้นกล้องจะนำตำแหน่งที่เห็นหน้าของเราไปคำนวณเพื่อแสดงผลออกมาเป็น 3 มิติ
ซึ่งหากว่าเทคนิคนี้ได้ผลลัพท์ที่ดีและมีคุณภาพพอ ไม่เพียงแค่ iPad 2 เท่านั้น แต่ยังใช้กับอุปกรณ์อื่นๆ ที่มีกล้องถ่ายข้างหน้าได้เช่นกัน แนะนำให้ดูวิดีโอข้างในแล้วจะเห็นภาพครับ