Dữ liệu là dầu mỏ mới - Data is a new Oil???

Tình cờ đọc bài báo này về dữ liệu và dữ liệu mở, trộm nghĩ có mấy dòng tầm phào như sau:

Quan điểm "dữ liệu là dầu mỏ mới": Các nhà nghiên cứu đưa ra quản điểm này chắc ý muốn nói dữ liệu rất quý, quý như "dầu mỏ". Nhưng tại sao không hình tượng hóa như là "dữ liệu là kim cương", "dữ liệu là vàng",... Nhất là giá dầu có vẻ đang xuống do mấy bác Nga ngố bị cấm vận, bị áp đặt giá trần đối với dầu thô 😁. Theo chủ quan của tớ thì bản chất sự cường điệu "dữ liệu là dầu mỏ mới" là: 

Thứ nhất: Dầu mỏ là tài nguyên quý, quan trọng,... ko có dầu thì năng lượng toàn cầu hiện nay sẽ bị đe dọa (còn tương lai ra sao thì không có biết).

Thứ hai: và quan trọng nhất từ dầu mỏ, chúng ta có thể tạo ra rất nhiều sản phẩmđể phục vụ con người, vì dụ sản phẩm từ dầu mỏ được minh họa bằng hình dưới đây (https://oilfieldteam.com/en/a/learning/Products-Made-From-Crude-Oil-Other-Uses-For-Crude)


Vậy "dữ liệu là dầu mỏ mới" chắc hản ý muốn nói: từ dữ liệu ta có thể làm ra nhiều sản phẩm tương tự đối với dầu mỏ....

Nhưng hiện nay có một quan điểm mới đó là "dữ liệu không phải là dầu mỏ, dữ liệu là đất đai". Phải chăng do giá đất ở Thủ Thiêm lên đến gần 2.4 tỷ VNĐ/m2 ... Kkkk. Chắc hẳn không phải vậy rồi. Thiển nghĩ "Dữ liệu là đất đai" thì đúng hơn nhiều. 

Một số ví dụ như thế này: 

- Dầu mỏ ở đâu cũng gần giống nhau, đất đai thì khác nhau và dữ liệu cũng vậy,

- Dầu mỏ không phải nơi nào cũng có, đất đai nơi nào cũng có và dữ liệu cũng vậy,

- Dầu mỏ ai cũng nhìn thấy giá trị, đất đai thì không phải ai cũng thấy có giá trị và dữ liệu cũng vậy.

- Dầu mỏ xài xong là hết, đất đai mãi mãi vẫn là đất đai, không biếtn mất được ...

Một vùng đất khô cằn chả ai thấy giá trị nhưng sẽ có ai đó biến thành một Thành phố sầm uất như Las Vegas. Dữ liệu cũng vậy thôi, ai cũng sài Google Map nhưng mấy ai sử dụng nó để tạo ra công ty như GRAB ???


Quan điểm về chất lượng dữ liệu mở: Nhiều ý kiến cho rằng: dữ liệu mở có chất lượng dữ liệu tốt hơn các dữ liệu không mở. Thực ra "đóng" hay "mở" chả liên quan đến chất lượng. Chất lượng dữ liệu phụ thuộc vào quy trình làm ra nó. Rất nhiều dữ liệu mở là dữ liệu có chất lượng thấp hay độ phân giải thấp đối với dữ liệu không gian địa lý và nhiều tổ chức họ cung cấp dữ liệu mở có chất lượng thấp. Các bạn hãy xài đi và khi cần dữ liệu có chất lượng cao hơn thì xin mời "xì ra chút tiền" 😁. Chất lượng thấp hay "đủ xài" còn phụ thuộc vào mục đích sử dụng của khách hàng, của người sử dụng. Ví dụ đơn giản như OSM (Open Street Map) được cộng đồng trên toàn thế giới cùng xây dựng và cung cấp miễn phí (open data) và được rất nhiều khách hàng dùng để tạo ra các sản phẩm của riêng mình. Nhưng nếu coi dữ liệu mở OSM có chất lượng cao mà dùng để giải tòa đền bù thì tương lai "nhập kho" là khó tránh khỏi. Chưa kể OSM đang bị lùm xùm vụ chủ quyền đối với Việt Nam chúng ta.
Vậy làm sao biết dữ liệu mở hay dữ liệu đóng có đủ tin cậy để xài??? Đó chính là nhiệm vụ của các Cổng dữ liệu. Các Cổng dữ liệu không đơn giản chỉ là đưa ra cái tiêu đề dữ liệu và một cái file dưới dạng gì đó để người ta download về mà phải mô tả rất tường minh, minh bạch, trung thực về bản chất của dữ liệu: Ai làm? làm bằng phương pháp nào? làm để phục vụ mục đích gì? Có vấn đề gì cần lưu ý khi sử dụng? Đã được cơ quan nào nghiệm thu? Nghiệm thu dựa trên quy định nào? .... Còn đối với người sử dụng phải đọc, hiểu rõ về dữ liệu và luôn đặt câu hỏi: "Dữ liệu này có phục vụ được cho mục đích của mình không?"
Quản điểm về miễn phí: Rất nhiều người cho rằng dữ liệu mở là free từ A-Z nhưng thực tế không đúng hoàn toàn. Dữ liệu mở là bản thân dữ liệu đó mở nhưng nhiều nơi cung cấp dữ liệu mở vẫn phải trả một khoản phí truy cập. Ở đây muốn nói rõ là "phí truy cập" chứ không phải là "phí dữ liệu". Thường phí truy cập có giá trị rất nhỏ bé đối với giá trị dữ liệu. Phí truy cập được sinh ra để bù lại một phần chi phí để bảo đảm phục vụ 24/7 khả năng người sử dụng, khách hàng có thể truy cập dịch vụ. Nhất là các dịch vụ cung cấp dữ liệu mở dạng API, Web Service,.... thường phải trả một khoản phí truy cập. Tổ chức nào miễn phí truy cập, tổ chức nào bắt trả phí truy cập? Điều này phụ thuộc vào tâm tư, nguyện vọng và túi tiền của họ, chúng ta không bàn ở đây. Tham khảo thêm quan điểm của EU về dữ liệu mở (được minh họa bằng hình dưới đây.

Dữ liệu có giá trị và dữ liệu không có giá trị: Nếu hiểu rõ tại sao người ta coi dữ liệu là "đất đai" (Data is Land) như đã nói ở trên thì rất dễ nhận ra rằng (trong ý thức): Tất cả các dữ liệu đều có giá trị!. Từng có một nhóm chuyên gia của Tổ chức Quốc tế phát biểu đại ý như sau: "Chúng ta chỉ cung cấp dữ liệu có giá trị", rồi bàn dữ liệu này có giá trị, dữ liệu kia không có giá trị ... Phát biểu này rất ấu trĩ vì chỉ là quan điểm riêng của nhóm dữ liệu này giá trị, dữ liệu kia không có giá trị. Dữ liệu ít nhất có giá trị đối với người làm ra nó. Hãy cứ cung cấp dữ liệu và ưu tiên dưới dạng dữ liệu mở ... một ngày nào đó có 1 sinh viên, có 1 start-up, ... có một cụ già, có một học sinh họ nhìn dữ liệu là phát sinh ra ý tưởng gì chăng??? Còn không có dữ liệu thì chẳng có ma nào có ý tưởng gì cả. 

Dữ liệu mở và đổi mới sáng tạo: Bàn về dữ liệu mở mà không bàn về "Đổi mới sáng tạo" thì tẻ nhạt và nhàm chán lắm. Nhiều bài viết như vậy và chả muốn đọc chút nào vì suy cho cùng Mở là để Sáng tạo, Sáng tạo để phục sự Xã hội và đóng góp lại cho Kinh tế. Túm lại : Open thì có xiền mà không Open thì không thấy xiền ở đâu. Còn khi nào có xiền thì ... không biết 😁.
Hình dưới minh họa đóng góp vào nền kinh tế Úc của Đổi mới sáng tạo dựa trên dữ liệu (Data - driven Innovation) năm 2013.

Thôi kệ, mấy GS cường điệu hóa về dữ liệu như thế nào cũng được, đang trồng rau và nuôi vịt nên không có ý kiến nhiều .... 😂

Nhận xét

Nhiều người xem nhất