Các tính năng thú vị nhất của Pixel 3 không liên quan gì đến điện thoại
Pixel 3 là điện thoại thực sự hỗ trợ AI đầu tiên của Google – từ sàng lọc các cuộc gọi của bạn trong thời gian thực đến chụp ảnh đẹp hơn những gì bạn có thể.
1 /5 [Ảnh: Google]
HƠN NHƯ THẾ NÀY
Nike là thương hiệu mới nhất thúc đẩy bình chọn. Có ai quan tâm không?
Tại sao thư viện Brooklyn này lại đặt cược vào một tương lai lớn hơn sách
Diễn viên đóng thế 60 phút của Trump chỉ là bức ảnh chế nhạo mới nhất của anh ấy. Những bức ảnh này chứng minh điều đó
CỦA MARK WILSON8 PHÚT ĐỌC
Giao diện và phần cứng đã định hình cho thập kỷ đổi mới điện thoại thông minh vừa qua, nhưng trí tuệ nhân tạo sẽ định hình cho thập kỷ tiếp theo. Không nơi nào điều đó rõ ràng hơn điện thoại thông minh Pixel 3 mới của Google, được công bố hôm nay tại một sự kiện ở New York. Các thiết bị mới sử dụng AI để làm mọi thứ, từ trả lời điện thoại cho bạn đến chụp ảnh rõ nét trong đêm tối.
Về thiết kế công nghiệp, bản cập nhật phần cứng của Pixel 3 là khá điển hình. Điện thoại đang trở nên nhanh hơn, màn hình tai thỏ phía trước đáng sợ, khả năng sạc không dây, tùy chọn màu hồng millennial "không phải màu hồng" đáng yêu và kích thước 5,5 inch và 6,3 inch có giá khởi điểm 799 USD. Thành thật mà nói: Đó là một chiếc Pixel chứa đầy mọi thứ mà bạn mong đợi một chiếc điện thoại thông minh sẽ có trong năm 2018.
Thay vào đó, để tạo sự khác biệt trên thị trường, Google đang tận dụng tài sản lớn nhất của mình: AI đầu ngành.
[Ảnh: Google]
Seang Chau, phó chủ tịch phần mềm Pixel cho biết: “Một trong những câu chuyện thú vị nhất mà chúng tôi có trong năm nay là việc chúng tôi đưa công nghệ máy học và AI vào sản phẩm như thế nào. “Tôi nghĩ đó là một trong những thứ cho phép Google tạo sự khác biệt cho chính mình”.
Pixel 3 được trang bị những siêu cường AI thân thiện với người dùng và quan trọng là nó không chạy tất cả AI đó từ đám mây, mà là cục bộ, ngay trên thiết bị thực của bạn. Điều đó có nghĩa là công ty có thể đưa ra nhiều tính năng nâng cao hơn trong thời gian thực, với mức tiêu thụ điện năng ít hơn và bảo mật hơn. Đó là chìa khóa tạo nên sự khác biệt cho phần mềm của điện thoại.
[Ảnh: Google]
Các công ty như Apple sử dụng AI trên thiết bị với ít phô trương hơn. Gần đây nhất, Apple đã bắt đầu sử dụng AI để phát hiện bạn trong chế độ chân dung của iOS, làm mờ nền của ảnh. Nó cũng sử dụng AI để đề xuất ứng dụng bạn mở tiếp theo, xây dựng các phím tắt vào biển ứng dụng trên điện thoại của bạn. Nhưng trong chuyến tham quan kéo dài hàng giờ của tôi về AI của Pixel 3, rõ ràng là Google đang tiến xa hơn Apple. Làm sao? Google đã đi trước Apple về điện toán đám mây (trường hợp điển hình: iCloud của Apple được xây dựng dựa trên đám mây của Google ). Và bây giờ nó thu nhỏ phần lớn số đó vào dạng điện thoại của bạn.
Sáng kiến chuyển AI sang điện thoại bắt đầu thành công vào năm ngoái, trước khi công bố Pixel 2. Các nhà phát triển của Google đã có thể sử dụng máy học để thu nhỏ thuật toán khớp bài hát khổng lồ của nó theo cách cho phép nó “nghe ”Bất kỳ trong số 70.000 bài hát của nó, giống với Shazam, với một tính năng gọi là Đang phát. AI rất nhỏ trên điện thoại của bạn và hầu như không tiêu thụ năng lượng, biến một ứng dụng độc lập như Shazam trở thành một thứ lỗi thời. Thay vào đó, bạn chỉ có thể nhìn xuống Pixel của mình và xem bài hát bạn đang thắc mắc trên màn hình khóa.
[Ảnh: Google]
Giờ đây, Google đang sử dụng bản đồ chỉ đường đằng sau tính năng Phát trực tiếp để làm điều tương tự cho tất cả các loại tính năng mới. Sử dụng công cụ Cuộc gọi màn hình mới. Khi bất kỳ ai gọi đến Pixel 3 của bạn, bạn có thể nhấn vào một nút để trợ lý trò chuyện thoại trả lời cuộc gọi đó và thay mặt bạn sàng lọc cuộc gọi đó. Trợ lý của bạn đọc một tập lệnh chứng khoán và yêu cầu người gọi xác định danh tính của họ. Trong khi đó, phần mềm sao chép bằng giọng nói thành văn bản trên thiết bị, hiển thị thông tin cho bạn giống như một tin nhắn văn bản. Nếu muốn, bạn có thể tiếp tục nhấn để biết thêm thông tin, bằng cách nhấn vào các tùy chọn khác nhau, được đóng hộp sẵn. Bạn thậm chí có thể chia sẻ rằng “Tôi sẽ gọi lại sau” hoặc chỉ cần báo cáo là spam và chặn số mãi mãi.
Cuộc gọi màn hình là một ví dụ hoàn hảo về lợi ích của việc chạy AI trên thiết bị so với trên đám mây. Trong khi thư thoại kèm theo hình ảnh hiện có cho phép các công ty như Verizon phiên âm thư thoại cho bạn, quá trình này có chút chậm trễ mà bạn, người dùng, không có quyền kiểm soát thực sự. Tuy nhiên, với AI trong tay bạn, trợ lý đó sẽ trở thành phần mềm hoạt động theo lịch trình của bạn - trong thời gian thực - để đối phó với những kẻ gửi thư rác.
Tương tự, các tính năng từ Google Lens –dịch vụ phân tích hình ảnh dựa trên đám mây của Google – giờ đây sẽ chạy trên Pixel 3. Điều đó có nghĩa là nếu bạn chụp ảnh danh thiếp, Lens có thể thấy rằng có một số điện thoại hoặc địa chỉ – có thể gọi được hoặc được mở trong Google Maps tương ứng với các nút xuất hiện trên màn hình.
Việc xem diễn ra trong thời gian thực là điều dễ hiểu, nhưng việc thiết kế chính xác cách giao diện người dùng phản ứng trong những thời điểm này rất khó.
“Triết lý chung của chúng tôi là chúng tôi muốn đảm bảo công nghệ được giữ cho người dùng tránh xa con đường của người dùng để nó không phải là điều họ phải nghĩ đến. Phần lớn, chúng tôi không muốn bạn phải đối mặt với điều đó, ”Chau nói. “Với đề xuất [Ống kính], chúng tôi đợi cho đến khi mã QR hoặc số điện thoại bằng X% màn hình trước khi đề xuất. Ngay cả khi chúng tôi nhìn thấy danh thiếp, chúng tôi không giới thiệu bất cứ điều gì cho đến khi chúng tôi nghĩ rằng rõ ràng đó là điều bạn muốn làm ”.
Thật vậy, hầu hết trí thông minh nhân tạo mà Google đang giới thiệu đều nằm trong chính máy ảnh của Pixel, trong đó phần lớn thời gian, người dùng có thể bỏ qua hoàn toàn các tính năng thông minh của nó hoặc hưởng lợi từ các hiệu ứng trong khi chúng không tồn tại một cách khôn ngoan hơn.
[Hình ảnh: Google]
Top Shot là một tính năng máy ảnh mới đảm bảo bạn luôn luôn mỉm cười, mở mắt, trong khung hình. Về cơ bản, nó có nghĩa là máy ảnh của bạn lấy các khung hình trước và sau khi bạn nhấn vào nút chụp – các khung hình được chụp ở độ phân giải thấp hơn bạn muốn. Nhưng với AI, Top Shot không chỉ phân tích các bức ảnh của bạn cho tất cả những điều thẩm mỹ mà chúng tôi muốn trong nhiếp ảnh thông thường, mà còn thực sự kết hợp dữ liệu hình ảnh từ những hình ảnh có độ phân giải cao tệ hại mà bạn đã chụp với nội dung của những bức ảnh có độ phân giải thấp tốt hơn mà nó đã chụp như một bản sao lưu. Phần mềm hợp nhất hai khung hình thành một hình ảnh HDR. AI của máy ảnh sẽ tái tạo lại khoảnh khắc mà nó đã bỏ lỡ về mặt kỹ thuật.
[Đây là zoom kỹ thuật số không mất dữ liệu, Ảnh: Google]
Phép thuật hình ảnh tương tự xảy ra khi phóng to – và trong ánh sáng yếu. Pixel 3 chỉ có một camera ở mặt sau và nó thiếu tính năng zoom quang học. Điều đó thường có nghĩa là việc phóng to thường được thực hiện kỹ thuật số bằng cách đơn giản là phóng to các pixel một cách mờ. Tuy nhiên, Pixel 3 nhận ra rằng bạn đã thu phóng và phân tích chéo khung hình bằng những chuyển động tinh tế, thay đổi của bạn. Mỗi chuyển động thực sự cung cấp nhiều dữ liệu pixel hơn cho cảm biến và tất cả các pixel này được kết hợp theo cách mà Google tuyên bố cho phép bạn phóng to ảnh gấp 2 lần mà không làm giảm chất lượng ảnh của bạn.
Tương tự như vậy, máy ảnh có chế độ Night Sight hoạt động theo cách tương tự. Khi bạn chụp một thứ gì đó tối, nó sẽ xếp chồng một số ảnh, kết hợp tất cả các bit sáng nhất, thành một ảnh mô phỏng một ảnh phơi sáng lâu.
[Ảnh: Google]
Trước đây, việc xử lý hình ảnh ở mức độ này có trong Google Photos, trực tuyến, nơi Google sử dụng tất cả các loại AI để xây dựng nguồn cấp dữ liệu mà bạn có thể thích cho ảnh của mình, giống như Facebook. Tuy nhiên, cho đến nay, nguồn cấp dữ liệu này là không đồng bộ thay vì thời gian thực. Điều đó có nghĩa là khi bạn đang ngủ vào ban đêm, Google Photos sẽ sử dụng AI để thực hiện những việc như kết hợp nhiều ảnh của con bạn thành các ảnh gif đáng yêu.
Trên Pixel 3, Google đang chuyển những cải tiến hình ảnh này vào lãnh thổ thời gian thực. Để làm như vậy, nhóm Pixel đang vay mượn và thu nhỏ công nghệ phần mềm từ nhóm Photos – sử dụng quy trình làm việc thu nhỏ AI tương tự như cách mà nó đã chạy Now Playing trên điện thoại thông minh. Các mô hình AI đằng sau những cải tiến ảnh này được đào tạo trên đám mây - công cụ này đòi hỏi sức mạnh xử lý rất lớn - nhưng khi hoàn thiện, chúng có thể tồn tại trên thiết bị của bạn dưới dạng công cụ phần mềm hoàn hảo để thực hiện một công việc hoàn hảo, chẳng hạn như làm sáng ảnh.
Về lý thuyết, việc xử lý xảy ra ở đâu không quan trọng đối với người dùng, nhưng trên thực tế, điều đó tạo nên sự khác biệt. Hầu hết các thủ thuật máy ảnh mới của Pixel sẽ không thể thực hiện được nếu chúng sống trong đám mây, vì bạn không thể có phản hồi thời gian thực trên màn hình mà bạn cần. Bạn không thể tải ảnh lên nhanh như điện thoại của bạn có thể chụp chúng, chứ đừng nói đến việc chờ xử lý và tải lại chúng xuống. Ví dụ: các tính năng Pixel AR mới của Google sẽ cho phép bạn thêm các nhãn dán giống Instagram vào video của mình. Nhưng với AI, các đối tượng trong cảnh được xác định theo thời gian thực, phản ứng với ngữ cảnh – một chiếc điện thoại trong khung hình hiển thị phim hoạt hình trò chuyện có nội dung “gọi cho tôi!” Hoặc bạn có thể mang theo các nhân vật Marvel, như Iron Man, để chụp ảnh selfie cùng bạn, mỉm cười hoặc nhún vai trong buổi hòa nhạc.
“Điều này không có nghĩa là sẽ không có các trường hợp sử dụng đám mây tuyệt vời. Nhưng luôn có những cân nhắc về độ trễ, công suất và dữ liệu khi chúng ta nói về các dịch vụ đám mây, ”Chau nói. “Chúng tôi tin rằng có những trường hợp sử dụng mà việc chạy độ trễ thấp, thời gian thực [AI] rất hợp lý vì nó mang lại trải nghiệm người dùng tốt hơn.”
Tất nhiên, có một lợi ích khá lớn để chạy AI cục bộ. Điều đó có nghĩa là bạn thường thu thập và xử lý hàng tấn dữ liệu bổ sung trên điện thoại của mình – một thiết bị vốn đã kém an toàn hơn các máy chủ của chính Google. (Về lý thuyết, đó là lý do vi phạm bảo mật gần đây trên Google+ .) Google đảm bảo với tôi rằng Google sẽ không nhìn thấy dữ liệu như các bài hát đang phát xung quanh bạn trong Đang phát. Tương tự, ảnh tự chụp với Người Sắt sẽ không bao giờ được Google nhìn thấy, trừ khi bạn sao lưu ảnh của mình vào máy chủ của Google. Local AI là một sự phát triển đầy hứa hẹn cho quyền riêng tư của người dùng. Nhưng điều đó không quan trọng nếu nội dung trong điện thoại của bạn có thể bị phần mềm độc hại hoặc các phương tiện khác tấn công – nếu về lý thuyết, một hacker có thể xâm nhập vào điện thoại của bạn và xem mọi thứ mà AI đã thấy.
Chau cho biết: “Càng làm nhiều việc trên thiết bị, chúng tôi càng phải bảo vệ những gì ở đó. Google đã cập nhật phần cứng Pixel 3 theo kiểu đầu tiên trong ngành – một chip bảo mật có tên là Titan M giúp lưu trữ tất cả mật khẩu của bạn theo cách được bảo vệ đến mức ngay cả CPU của điện thoại thông minh của bạn cũng không thể nhìn thấy dữ liệu. Con chip này cũng có thể tạo ra các tùy chọn đăng nhập hai yếu tố tương tự mà trình bảo vệ mật khẩu Titan Key của Google sử dụng – có nghĩa là điện thoại cũng có thể mở khóa an toàn tất cả các loại trang web và thậm chí có thể là phần cứng Internet of Things trong cuộc sống của bạn.
Trong một thế giới mà chúng ta ngày càng phụ thuộc vào các tập đoàn như Google để giữ an toàn cho chúng ta – và các tập đoàn đó ngày càng phụ thuộc vào việc theo dõi mọi động thái của chúng ta để phục vụ các nhà quảng cáo – AI địa phương là một giải pháp thay thế hấp dẫn. Tôi không ngây thơ đến mức nghĩ rằng công nghệ này sẽ cho phép tôi sử dụng Android mà không bị theo dõi, nhưng bằng cách di chuyển AI đến gần chúng ta hơn, Google đang đặt khoảng cách hơn một chút giữa điện thoại của chúng tôi và máy chủ của nó. Thật kỳ lạ, AI được bản địa hóa có thể giúp giữ lại một số khía cạnh của quyền riêng tư cá nhân mà không cần chúng ta cất điện thoại và di chuyển đến hang động. Ít nhất, nó sẽ giúp ích cho những bức ảnh selfie của Iron Man.
Nhận xét
Đăng nhận xét