Dữ liệu lớn là gì, tại sao nó quan trọng và nó nguy hiểm như thế nào?

Dữ liệu lớn là gì, tại sao nó quan trọng và nó nguy hiểm như thế nào?

Dữ liệu là thông tin, nhưng đó chỉ là một phần của câu chuyện. Một chi tiết về một sự kiện hoặc một sự thật về sức khỏe con người không có nhiều dữ liệu để làm việc. Đó là việc thu thập, tổ chức và lưu trữ thông tin mà chúng ta nghĩ đến khi nói về dữ liệu.





Trong thời đại internet, các công ty và tổ chức trên khắp thế giới đã thu thập rất nhiều dữ liệu đến nỗi giờ đây chúng ta đang nói về các vấn đề trên quy mô lớn hơn theo cấp số nhân. Bây giờ có dữ liệu lớn và nó có tác động rất lớn đến cuộc sống của chúng ta.





Dữ liệu lớn là gì?

Dữ liệu lớn là một tập dữ liệu lớn đến mức các phương tiện quản lý thông tin truyền thống của chúng ta không phù hợp với công việc. Bộ sưu tập này có thể có nhiều dạng.





Ví dụ về Dữ liệu lớn

  • Các tweet được lưu trữ trên máy chủ của Twitter
  • Thông tin Google thu được từ việc theo dõi các chuyến đi ô tô
  • Tập hợp đầy đủ các kết quả bầu cử địa phương và quốc gia của một quốc gia, quay ngược lại khi các hồ sơ đã được lưu giữ
  • Những công ty bảo hiểm y tế biết ai được điều trị tại bệnh viện nào
  • Các loại mua hàng và địa điểm xuất hiện trên thẻ tín dụng
  • Mọi người xem gì trên Netflix, khi nào, ở đâu và bao lâu

Công nghệ dữ liệu lớn là gì?

PC của chúng tôi có thể quản lý khá nhiều dữ liệu. Chỉ cần tưởng tượng tất cả thông tin có thể nhồi nhét vào một bảng tính. Phần mềm cơ sở dữ liệu có khả năng xử lý khối lượng thông tin cao hơn nữa. Những công cụ này có thể nhồi nhét vào một dữ liệu ổ cứng duy nhất mà nếu không sẽ yêu cầu các giá chứa đầy các hộp chứa đầy sổ ghi chép và thư mục.

Nhưng những công cụ này không đủ để xử lý tất cả khối lượng thông tin mà chúng tôi gọi là dữ liệu lớn. Vì vậy, chúng tôi đã phát triển các phương pháp mới. Điện toán đám mây giảm tải công việc từ PC của chúng tôi lên các máy chủ ở xa. Từ đó, có bất kỳ cách nào để truy cập và sử dụng thông tin.



Sử dụng đáng chú ý cho dữ liệu lớn

Dữ liệu lớn không tự xuất hiện. Một số xu hướng đã khuyến khích sự tồn tại của nó.

Internet of Things

Internet mà bạn biết là internet của mọi người. Đây là nơi mọi người tương tác với nhau, với máy móc hỗ trợ giao tiếp đó. Bạn xem các trang web mà mọi người thiết kế. Bạn đọc những từ mà mọi người đã gõ.





Internet of Things là một trong những nơi các thiết bị giao tiếp trực tiếp với nhau mà không cần sự tham gia của con người. Một thiết bị giám sát thời tiết. Bộ điều nhiệt thông minh truy cập thông tin đó và điều chỉnh nhiệt độ trong nhà của bạn.

Dữ liệu lớn và Internet of Things phụ thuộc lẫn nhau. Các thiết bị này có thể tự thực hiện hành động nhờ vào tất cả dữ liệu có sẵn cho chúng. Càng nhiều thiết bị hoạt động theo cách này, thì càng nhiều dữ liệu được tạo ra.





Học máy

Máy học đề cập đến khả năng học từ dữ liệu của máy tính. Đây là cách các đài phát thanh Pandora tạo nên phong cách cụ thể của bạn. Máy học cũng đứng sau các đề xuất nội dung trên YouTube và Netflix.

Những dự đoán này là do thuật toán. Thuật toán tìm kiếm của Google? Thuật toán xác định những gì bạn nhìn thấy trong nguồn cấp tin tức của Facebook? Đây là tất cả học máy tại nơi làm việc.

Đây chỉ là một vài ví dụ về cách các thuật toán học máy ảnh hưởng đến trải nghiệm hàng ngày của chúng ta.

Trí tuệ nhân tạo

Trí tuệ nhân tạo là bước tiếp theo sau máy học. Ở đây, máy tính không chỉ học từ dữ liệu mà còn sử dụng thông tin đó để đưa ra quyết định của riêng nó và định hình hành vi của chính nó.

Microsoft và Google đều đã thể hiện nỗ lực tạo ra robot hình người. Facebook đang sử dụng trí thông minh nhân tạo để giúp ngăn chặn các vụ tự tử. Công nghệ đang phát triển với tốc độ mà đã có một số trường hợp trong đó tư duy của máy tính vượt trội hơn con người.

Phân tích dữ liệu lớn là gì?

Các nguồn dữ liệu lớn không cho chúng ta biết bất cứ điều gì riêng của chúng. Ai đó phải hiểu tất cả thông tin đó. Đây là những gì mà lĩnh vực phân tích dữ liệu lớn hướng đến: xem xét khối lượng thông tin lớn không thể hiểu được và xem chúng ta có thể học được gì.

Ngày nay, nhiều tổ chức đang bắt đầu các dự án dữ liệu lớn mới và các công ty đang cạnh tranh để đưa ra hình thức phân tích dữ liệu lớn cụ thể của họ trên nhiều lĩnh vực khác nhau. Thông qua những hành động này, dữ liệu lớn đang có ảnh hưởng đến cuộc sống của bạn, ngay cả khi bạn là một Luddite hiện đại.

Tại sao mọi người lại làm điều này? Bởi vì với sự hiểu biết đúng đắn, dữ liệu lớn có thể làm được rất nhiều điều tốt.

Lợi ích của Dữ liệu lớn

Mọi người đang đua nhau sử dụng dữ liệu lớn để cải thiện cuộc sống của chúng ta. Dưới đây là một số lĩnh vực mà dữ liệu lớn đang hoạt động.

cách xóa tài khoản đã liên kết

Dữ liệu lớn trong chăm sóc sức khỏe

Ngành công nghiệp chăm sóc sức khỏe không phải là ngành nhanh nhất trong việc áp dụng các công nghệ mới. Một số nhà cung cấp vẫn đang chuyển từ giấy sang các phương tiện lưu trữ kỹ thuật số. Tuy nhiên, có những lĩnh vực mà dữ liệu lớn đang tạo ra sự khác biệt. Một là lĩnh vực hội nhập. Các công ty bảo hiểm và nhà cung cấp đang làm việc để kết hợp dữ liệu từ các nguồn khác nhau, chẳng hạn như yêu cầu bồi thường, chụp X-quang, ghi chú của bác sĩ và đơn thuốc.

Tín dụng Hình ảnh: MGDboston / Morguefile

Nhiều người tin rằng nếu dữ liệu chăm sóc sức khỏe được tích hợp tốt hơn, điều này có thể cung cấp dịch vụ chăm sóc tốt hơn với chi phí thấp hơn. Khi Amazon, Berkshire Hathaway và JP Morgan thông báo vào đầu năm nay rằng họ đang làm việc cùng nhau trong lĩnh vực chăm sóc sức khỏe, họ đã trích dẫn công nghệ là lĩnh vực trọng tâm của họ, như Người giám hộ bìa.

Dữ liệu lớn trong tài chính

Ngành tài chính dựa trên ý tưởng đưa ra quyết định dựa trên phân tích máy tính. Sự sụp đổ chớp nhoáng của Phố Wall là do giao dịch tự động, với việc máy móc nhanh chóng bán hết hàng mà không có sự can thiệp của con người, dựa trên những gì đang diễn ra trên thị trường. Đây được gọi là giao dịch tần suất cao.

Giờ đây, các nhà khoa học dữ liệu tài chính sử dụng dữ liệu lớn để dự đoán cổ phiếu nào sẽ thành công và khi nào có khả năng xảy ra sự cố trong tương lai. Các ngân hàng cũng coi dữ liệu lớn là một cách để tăng doanh thu của họ.

Dữ liệu lớn trong Thương mại điện tử và Tiếp thị

Chúng tôi tạo ra rất nhiều thông tin khi chúng tôi mua sắm. Trong cửa hàng, thẻ tín dụng và thẻ khách hàng thân thiết theo dõi mọi giao dịch mua hàng của chúng tôi. Một số cửa hàng sử dụng máy ảnh hoặc thậm chí theo dõi điện thoại của chúng tôi để xem phần nào của cửa hàng thu hút sự chú ý của chúng tôi lâu nhất. Trực tuyến, chúng tôi phải tạo tài khoản trước khi mua sắm, cho phép các trang web không chỉ theo dõi những gì chúng tôi mua mà còn mọi mặt hàng mà chúng tôi xem.

Các cửa hàng bố trí dựa trên sở thích và hành vi của người tiêu dùng. Người bán hàng trực tuyến quyết định những gì chúng tôi thấy dựa trên thông tin nhân khẩu học và các số liệu khác. Các cửa hàng truyền thống mới của Amazon là một ví dụ về việc hai thế giới hợp nhất với nhau.

Nhu cầu lớn về loại hình thông tin chi tiết đến từ việc theo dõi sở thích và hành vi trực tuyến của chúng ta. Facebook và Google là những gã khổng lồ công nghệ có lợi nhuận nhờ khả năng bán quảng cáo nhắm mục tiêu các nhóm người tiêu dùng cụ thể tốt hơn so với các phương pháp và nền tảng quảng cáo khác. Họ có thể làm được điều này nhờ vào tất cả thông tin chúng tôi cung cấp khi chúng tôi sử dụng dịch vụ của họ.

Dữ liệu lớn có nguy hiểm không?

Dữ liệu lớn đi kèm với hứa hẹn, nhưng nó cũng đi kèm với rủi ro. Đầu tiên là sự xói mòn quyền riêng tư. Nhiều người biết về mỗi chúng ta hơn bất kỳ thời điểm nào trong lịch sử nhân loại. Không chỉ dễ dàng tìm thấy nơi chúng ta sống, mà còn là nơi chúng ta đi, người chúng ta yêu, cách chúng ta sống và những gì chúng ta nghĩ.

Điều này làm cho các cá nhân và xã hội cởi mở hơn với sự thao túng. Chúng tôi có thể bị lừa từ bỏ mật khẩu và số thẻ tín dụng của mình hoặc bị ảnh hưởng để bỏ phiếu cho các ứng cử viên mà chúng tôi sẽ không hỗ trợ. Nhiều dữ liệu hơn cung cấp nhiều cách hơn cho các nhà quảng cáo và công ty truyền thông để định hình mong muốn và giá trị của chúng tôi.

Có nhiều dữ liệu về chúng tôi hơn trước và dữ liệu đó được lưu trữ ở nhiều nơi hơn. Điều đó tạo ra nhiều mục tiêu hơn để tấn công. Không còn đủ để bảo vệ máy móc của chúng ta nữa. Vi phạm dữ liệu hiện là một điều thường xuyên xảy ra, với những gì xảy ra với dữ liệu của chúng tôi nằm ngoài tầm kiểm soát của chúng tôi.

Ngay cả những công ty có thể làm tốt công việc bảo vệ dữ liệu của chúng ta khỏi sự tấn công từ bên ngoài cũng thường tự làm những điều đáng ngờ với dữ liệu đó, như trường hợp của Facebook.

Sau đó, có rủi ro về những gì mọi người làm với thông tin dữ liệu lớn cho phép họ dự đoán. Chúng ta có tính phí những người có thói quen ăn uống không lành mạnh cho bảo hiểm y tế nhiều hơn không? Chúng ta có nên tăng cường kiểm soát an ninh ở những khu vực mà chúng ta dự đoán sẽ có nhiều tội phạm hơn không? Chúng ta có tăng giá cho những người mua sắm trực tuyến sống ở các khu vực giàu có không?

Tìm cách giữ cho dữ liệu của chúng ta an toàn, quyền riêng tư của chúng ta được tôn trọng và các giá trị của chúng ta được duy trì sẽ là những thách thức liên tục khi xu hướng dữ liệu lớn tiếp tục. Tuy nhiên, bất kể chúng ta cảm thấy thế nào về nó, tốt hơn hay tệ hơn, tất cả chúng ta đều sống trong một thế giới dữ liệu lớn.

Đăng lại Đăng lại tiếng riu ríu E-mail Cách truy cập Cấp bong bóng tích hợp của Google trên Android

Nếu bạn đã từng cần đảm bảo thứ gì đó ở mức vừa phải, thì giờ đây, bạn có thể có được mức bong bóng trên điện thoại của mình trong vài giây.

Đọc tiếp
Chủ đề liên quan
  • Giải thích về công nghệ
  • Internet of Things
  • Dữ liệu lớn
Giới thiệu về tác giả Bertel King(Đã xuất bản 323 bài báo)

Bertel là một người theo chủ nghĩa tối giản về kỹ thuật số, người viết từ một máy tính xách tay có công tắc bảo mật vật lý và một hệ điều hành được xác nhận bởi Tổ chức Phần mềm Tự do. Anh ấy coi trọng đạo đức đối với các tính năng và giúp những người khác kiểm soát cuộc sống kỹ thuật số của họ.

Xem thêm từ Bertel King

Theo dõi bản tin của chúng tôi

Tham gia bản tin của chúng tôi để biết các mẹo công nghệ, đánh giá, sách điện tử miễn phí và các ưu đãi độc quyền!

Bấm vào đây để đăng ký