5
Tạp chí KH-CN Nghệ An SỐ 4/2015 [40] NGHIÊN CỨU - TRAO ĐỔI “trong khoảng” bao nhiêu mà vẫn đem lại các dự đoán có giá trị cho chính bản thân và đối tác như Amazon khai thác thói quen duyệt web của khách hàng để gợi ý họ mua thêm sách, bổ trợ cho các quảng cáo, Walmart khai thác thông tin và nắm được nhu cầu người mua dựa theo chu kỳ mua sắm, mật độ giao thông hay yếu tố thời tiết… Có thể nhận thấy rằng, hoàn toàn không nhất thiết dữ liệu thông tin phải là cụ thể hay chính xác tuyệt đối, bởi sự cụ thể hay chính xác tuyệt đối là giá trị của dữ liệu nhỏ. Xin đưa thêm ra đây một vài ví dụ điển hình về Big Data. Vào năm 2009, một vi-rút cúm H1N1 được phát hiện rồi lây lan vô cùng nhanh chóng chỉ trong một vài tuần làm cả thế giới lo sợ về một đại dịch bệnh khủng khiếp có thể xảy ra với quy mô như dịch cúm ở Tây Ban Nha vào năm 1918 làm lây nhiễm cho nửa tỷ người và làm chết hàng chục triệu người (3) . Trong khi chưa hề có vắc-xin nào có thể chống lại vi-rút mới này thì điều quan trọng nhất là chúng ta cần biết bệnh dịch đã lây lan tới đâu. Những người bị bệnh có thể tới vài ngày mới đến gặp bác sĩ, việc chuyển tiếp thông tin về các cơ quan hữu quan đòi hỏi phải có thời gian và với một bệnh dịch lây lan nhanh, sự chậm trễ này đã hoàn toàn vô hiệu hóa các cơ quan y tế tại những thời điểm gay cấn nhất. Tuy nhiên, Google 1. Big Data Big Data giờ đây không phải là khái niệm còn rất mới mẻ với chúng ta, trong khi thế giới đã bắt đầu nói nhiều đến Big Brother (2) . Từ nửa cuối năm 2013, trên các phương tiện truyền thông và các diễn đàn khoa học và công nghệ (KH&CN), Big Data đã dành được sự quan tâm và có những trao đổi, thảo luận thiết thực, thậm chí nó đã được triển khai ứng dụng, đặc biệt trong phân tích tài chính và thị trường chứng khoán. Ở một số nước như Anh, Pháp, Mỹ, Hà Lan hay Nhật Bản, Big Data được dùng phổ biến trong nhiều ngành, lĩnh vực từ bán lẻ, ngân hàng, dự báo thời tiết tới dược phẩm, thiết bị y tế hay công nghệ sinh học... Với Big Data, chúng ta sẽ hiểu sâu sắc hơn về giá trị của những thông tin tưởng chừng như rất đỗi bình thường qua số lượng “like, comments” trên Facebook, những dữ liệu tư duy, suy nghĩ của hàng triệu người dùng trên Twitter hay những bức ảnh chỉ được ghi chung chung rằng được đăng tải một vài thời gian trước đó mà không cụ thể, chính xác khi nào trên Instagram. Với Big Data - Dữ liệu lớn, chúng ta chỉ cần nắm biết được một lượng thông tin “áng chừng” hay T hay vì cách làm phổ biến là hầu hết mọi dữ liệu đều được lưu trữ trong ổ cứng của máy tính, đĩa CD-ROM, USB, thì hiện nay với sự hỗ trợ của nền tảng điện toán đám mây và internet, mọi thứ đều được số hóa và đưa lên điện toán đám mây để khai thác qua các ứng dụng trên thiết bị thông minh khiến cho thế giới tràn ngập thông tin, sinh ra một lượng dữ liệu khổng lồ. Sự thay đổi về quy mô đã dẫn đến một sự thay đổi trạng thái; thay đổi về lượng đã dẫn tới thay đổi về chất. Các khoa học như thiên văn, gen bùng nổ trong những năm 2000 đã đưa ra thuật ngữ “Dữ liệu lớn” và khái niệm Big Data ra đời làm thay đổi to lớn cách vận hành truyền thống của xã hội, di trú vào tất cả các lĩnh vực của đời sống con người (1) . Ứng dụng Big Data n Nguyễn Như Hà Trường Đại học KHXH&NV, Đại học Quốc gia Hà Nội VÀO VIỆC KHẢO SÁT, ĐÁNH GIÁ TIềM NăNG, PHÁT TRIỂN KH&CN NGHỆ AN

Ứng dụng Big Data - ngheandost.gov.vn NCTD_05.pdf · làm thay đổi to lớn cách vận hành truyền thống của xã hội, di trú vào tất cả các ... có phần

  • Upload
    vodan

  • View
    218

  • Download
    3

Embed Size (px)

Citation preview

Page 1: Ứng dụng Big Data - ngheandost.gov.vn NCTD_05.pdf · làm thay đổi to lớn cách vận hành truyền thống của xã hội, di trú vào tất cả các ... có phần

Tạp chíKH-CN Nghệ An

SỐ 4/2015 [40]

NGHIÊN CỨU - TRAO ĐỔI

“trong khoảng” bao nhiêu mà vẫn đem lại các dự đoáncó giá trị cho chính bản thân và đối tác như Amazonkhai thác thói quen duyệt web của khách hàng để gợi ýhọ mua thêm sách, bổ trợ cho các quảng cáo, Walmartkhai thác thông tin và nắm được nhu cầu người muadựa theo chu kỳ mua sắm, mật độ giao thông hay yếutố thời tiết… Có thể nhận thấy rằng, hoàn toàn khôngnhất thiết dữ liệu thông tin phải là cụ thể hay chính xáctuyệt đối, bởi sự cụ thể hay chính xác tuyệt đối là giátrị của dữ liệu nhỏ.

Xin đưa thêm ra đây một vài ví dụ điển hình về BigData. Vào năm 2009, một vi-rút cúm H1N1 được pháthiện rồi lây lan vô cùng nhanh chóng chỉ trong mộtvài tuần làm cả thế giới lo sợ về một đại dịch bệnhkhủng khiếp có thể xảy ra với quy mô như dịch cúmở Tây Ban Nha vào năm 1918 làm lây nhiễm cho nửatỷ người và làm chết hàng chục triệu người(3). Trongkhi chưa hề có vắc-xin nào có thể chống lại vi-rút mớinày thì điều quan trọng nhất là chúng ta cần biết bệnhdịch đã lây lan tới đâu. Những người bị bệnh có thểtới vài ngày mới đến gặp bác sĩ, việc chuyển tiếpthông tin về các cơ quan hữu quan đòi hỏi phải có thờigian và với một bệnh dịch lây lan nhanh, sự chậm trễnày đã hoàn toàn vô hiệu hóa các cơ quan y tế tạinhững thời điểm gay cấn nhất. Tuy nhiên, Google

1. Big DataBig Data giờ đây không phải là khái niệm

còn rất mới mẻ với chúng ta, trong khi thế giớiđã bắt đầu nói nhiều đến Big Brother(2). Từ nửacuối năm 2013, trên các phương tiện truyềnthông và các diễn đàn khoa học và công nghệ(KH&CN), Big Data đã dành được sự quan tâmvà có những trao đổi, thảo luận thiết thực, thậmchí nó đã được triển khai ứng dụng, đặc biệttrong phân tích tài chính và thị trường chứngkhoán. Ở một số nước như Anh, Pháp, Mỹ, HàLan hay Nhật Bản, Big Data được dùng phổbiến trong nhiều ngành, lĩnh vực từ bán lẻ, ngânhàng, dự báo thời tiết tới dược phẩm, thiết bị ytế hay công nghệ sinh học... Với Big Data,chúng ta sẽ hiểu sâu sắc hơn về giá trị củanhững thông tin tưởng chừng như rất đỗi bìnhthường qua số lượng “like, comments” trênFacebook, những dữ liệu tư duy, suy nghĩ củahàng triệu người dùng trên Twitter hay nhữngbức ảnh chỉ được ghi chung chung rằng đượcđăng tải một vài thời gian trước đó mà khôngcụ thể, chính xác khi nào trên Instagram. VớiBig Data - Dữ liệu lớn, chúng ta chỉ cần nắmbiết được một lượng thông tin “áng chừng” hay

Thay vì cách làm phổ biến là hầu hết mọi dữ liệu đều được lưu trữ trong ổ cứng củamáy tính, đĩa CD-ROM, USB, thì hiện nay với sự hỗ trợ của nền tảng điện toán đámmây và internet, mọi thứ đều được số hóa và đưa lên điện toán đám mây để khai

thác qua các ứng dụng trên thiết bị thông minh khiến cho thế giới tràn ngập thông tin, sinhra một lượng dữ liệu khổng lồ. Sự thay đổi về quy mô đã dẫn đến một sự thay đổi trạngthái; thay đổi về lượng đã dẫn tới thay đổi về chất. Các khoa học như thiên văn, gen bùngnổ trong những năm 2000 đã đưa ra thuật ngữ “Dữ liệu lớn” và khái niệm Big Data ra đờilàm thay đổi to lớn cách vận hành truyền thống của xã hội, di trú vào tất cả các lĩnh vực củađời sống con người(1).

Ứng dụng Big Data

n Nguyễn Như HàTrường Đại học KHXH&NV, Đại học Quốc gia Hà Nội

VÀO VIỆC KHẢO SÁT, ĐÁNH GIÁ TIềM NăNG, PHÁT TRIỂN KH&CN NGHỆ AN

Page 2: Ứng dụng Big Data - ngheandost.gov.vn NCTD_05.pdf · làm thay đổi to lớn cách vận hành truyền thống của xã hội, di trú vào tất cả các ... có phần

Tạp chíKH-CN Nghệ An

SỐ 4/2015 [41]

NGHIÊN CỨU - TRAO ĐỔI

2. Nghệ An với việc ứng dụng Big DataNghệ An là một tỉnh có diện tích tự nhiên lớn nhất

Việt Nam thuộc vùng Bắc Trung Bộ(6) với nhiều lợithế hơn các tỉnh bạn. Vị trí địa lý của tỉnh Nghệ Annằm trên trục giao thông Bắc - Nam cả về đường bộ,đường sắt, đường biển lẫn đường hàng không. Vì vậy,tỉnh có nhiều thuận lợi trong việc giao lưu kinh tế vớicác tỉnh thành trong cả nước và một số nước trong khuvực. Bên cạnh đó, tỉnh còn có lợi thế là quỹ đất nôngnghiệp rộng hơn 19,5 vạn ha, diện tích đất trống, đồinúi trọc chưa sử dụng trên 58 vạn ha, tài nguyên rừngvà biển rất phong phú với nhiều loại cây, con có giátrị kinh tế cao. Mặc dù thời tiết có phần khắc nghiệt,

khi nắng nóng, khi bão lụt nhưng khí hậu ở đây lạithích hợp với nhiều loại cây trồng và vật nuôi như:lúa, lạc, vừng, mía, dứa, chuối; một số cây côngnghiệp, cây ăn quả như: cà phê, cao su, cam, nhãn,xoài... Bên cạnh đó, nguồn nhân lực của tỉnh lại tươngđối dồi dào, có truyền thống cần cù, hiếu học, trình độsản xuất ngày càng cao. Đây là những thuận lợi đểthúc đẩy Nghệ An phát triển kinh tế toàn diện cả vềnông - lâm - ngư nghiệp, công nghiệp và dịch vụ trongtương lai(7).

Hoạt động nghiên cứu khoa học ở Nghệ An ngàycàng hiệu quả, có tính lan tỏa và xuất hiện nhiều đềtài, dự án KH&CN nổi trội như: Đã nghiên cứu ứngdụng và thương mại hóa một số sản phẩm khoa học:chế phẩm biogreen, chế phẩm dùng để sản xuất thứcăn cho trâu bò theo công nghệ vi sinh; Nuôi cá bằnglồng trên hồ nước lớn; Chương trình bảo tồn quỹ gen;Chương trình Sở hữu trí tuệ được triển khai, hướngviệc sản xuất các sản phẩm truyền thống đặc thù thành

bằng cách xem xét những gì người sử dụngđang tìm kiếm trên internet đã nhận được hơnba tỷ câu hỏi mỗi ngày và lưu giữ tất cả chúngđể phân tích rồi “dự đoán” được sự lây lan củabệnh cúm theo không gian, chỉ báo gần nhưtrong thời gian thực, góp phần to lớn ngănchặn sự phát triển của dịch bệnh(4).

Một ứng dụng sớm khác của Big Data là sửdụng dữ liệu từ các cảm biến đặt trong các sảnphẩm từ đồ chơi trẻ em đến hàng hóa côngnghiệp để xem các sản phẩm này được sử dụngtrong thực tế như thế nào. Những thông tin thuthập được sẽ dùng để tạo ra các dịch vụ mớivà thiết kế sản phẩm cho tương lai.Các máy móc thu nhận dữ liệu, thiếtbị công nghiệp, cảm biến, dụng cụgiám sát, mỗi hệ thống như lò hạtnhân, máy bay… đều gồm hàngtrăm nghìn bộ cảm ứng. Hoạt độngcủa các hệ thống phải dựa vào quyếtđịnh được đưa ra theo kết quả tínhtoán và phân tích những tổ hợp dữliệu của các cảm biến này. Thuậtngữ Dữ liệu lớn miêu tả một sự giatăng theo cấp luỹ thừa của dunglượng dữ liệu, đó là các tập dữ liệurất lớn vượt quá khả năng vậnchuyển mà những phương pháp hiệntại của công nghệ thông tin chưa thểlưu trữ, xử lý và phân tích tốt được.Dữ liệu lớn không chỉ mô tả tínhchất lớn mà còn bao hàm một sự phức tạp vôcùng trong đó, là sự thách thức làm cho conngười phải thay đổi cách tư duy, cách tiến hànhquá trình tìm hiểu và nghiên cứu mọi lĩnh vựctrong đời sống xã hội.

Việc khai thác thông tin theo những cáchthức mới để đưa ra những kiến thức hữu íchhay những sản phẩm và dịch vụ có giá trị đángkể chính là điều mà ngày nay chúng ta đanghướng đến. Trong khi chính phủ của các nướctiên tiến ủng hộ và kêu gọi ứng dụng lĩnh vựccông nghệ này vào việc quản lý hành chínhnhà nước, quản lý dân số, quân đội, y tế, hàngkhông, dự báo thời tiết, giao thông, tiềm năngkinh tế, hạn chế rủi ro, đảm bảo phát triển bềnvững…(5) thì chúng ta vẫn chỉ dừng lại ở mứcđộ tìm hiểu, áp dụng hạn hẹp, chưa thực sự“nhảy” vào để khai thác mảng dữ liệu màu mỡmà mình đang có.

Page 3: Ứng dụng Big Data - ngheandost.gov.vn NCTD_05.pdf · làm thay đổi to lớn cách vận hành truyền thống của xã hội, di trú vào tất cả các ... có phần

Tạp chíKH-CN Nghệ An

SỐ 4/2015 [42]

NGHIÊN CỨU - TRAO ĐỔI

lượng lớn dữ liệu nhưng việc khai thác lượng dữ liệunày một cách có hiệu quả như thế nào còn tuỳ thuộcvào việc xử lý, phối hợp xử lý, phối hợp đánh giá vànhạy bén đưa ra các giải pháp, chiến lược hữu ích. Đểlàm được việc này, không thể chỉ hiểu đơn thuần làviệc thu thập thật nhiều dữ liệu từ đủ mọi loại dạngthức, từ nhiều nguồn khác nhau để rồi phân tích và tổchức chúng để cung cấp thông tin bản chất cho quyếtđịnh của các cấp quản lý. Công việc này trong BigData đòi hỏi phải có kỹ năng quản trị cơ sở dữ liệu vàkhai phá dữ liệu để thu thập, định dạng, tổ chức và lưugiữ chúng trong một kho dữ liệu riêng; Phải có kỹnăng toán học, thống kê và tích hợp để phân tích khodữ liệu đó và biến chúng thành thông tin có ích; Phảinắm bắt được kỹ năng trinh sát doanh nghiệp, trựcquan hóa và đồ họa để biểu diễn thông tin dưới cácdạng sơ đồ, đồ thị hay độ đo dùng trong OLAP; Cuốicùng là sử dụng kỹ năng toán học, thống kê, dự báođể đưa ra các báo cáo dự báo, dự đoán về xu thế.

Trong quá trình triển khai, ứng dụng công nghệ BigData, chúng ta đều biết rằng dữ liệu nếu không đượckhai thác sẽ chỉ là các lưu trữ rời rạc và vô nghĩa. Nóchỉ có giá trị to lớn khi được trao cho những công typhân tích và khai phá dữ liệu chuyên nghiệp, vào taynhững chuyên gia - những data scientist - cần đượcthu hút và trọng dụng trong kế hoạch phát triểnKH&CN của tỉnh. Phương châm trong cách thức sửdụng dữ liệu là tìm hiểu “Cái gì” chứ không phải là“Tại sao”.

Dữ liệu lớn đề cập tới những thứ người ta có thểlàm với một quy mô lớn mà không thể làm với mộtquy mô nhỏ hơn, để trích xuất những hiểu biết mớihoặc tạo ra những giá trị mới, theo những cách thứccó thể làm thay đổi các thị trường, các tổ chức, mốiquan hệ giữa các công dân và các chính phủ và hơnthế nữa. Big Data chứa trong mình rất nhiều thông tinquý giá mà nếu trích xuất thành công, nó sẽ giúp rấtnhiều cho việc kinh doanh, nghiên cứu khoa học, dựđoán các dịch bệnh sắp phát sinh, phân tích kết quả yhọc của dược phẩm khi chúng được kê đơn rộng rãivà thậm chí là cả việc xác định điều kiện giao thôngtheo thời gian thực. Kính thiên văn tạo điều kiện chochúng ta hiểu biết được vũ trụ và kính hiển vi chophép chúng ta hiểu biết được vi trùng, các kỹ thuậtmới để thu thập và phân tích những tập hợp lớn dữliệu sẽ giúp chúng ta tìm ra ý nghĩa của thế giới theonhững cách thức mà chúng ta mới chỉ bắt đầu ưa thích.Tuy nhiên, vấn đề nhiều người lo ngại rằng sẽ xử lýthế nào với các dữ liệu sai hoặc không chính xác. Ởthời Dữ liệu lớn, ngay cả các dữ liệu không chính xác

sản phẩm hàng hóa: bò u đầu rìu, trâu ThanhChương, cây Mú từn, sâm Puxailaileng, đẳngsâm, trà hoa vàng, lạc sen, lạc cúc, gà ThanhChương, gạo Mường Nọc Quế Phong; Đã vàđang tiến hành phát sóng các bản tin phản ánhđược các hoạt động của các doanh nghiệp, làngnghề, tổ chức KH&CN, giới thiệu một số điểnhình trong thực hiện và phát triển tài sản trítuệ; Phát hiện, nêu lên những vụ xâm phạmquyền sở hữu trí tuệ thường gặp trong đời sốnghàng ngày. Các phóng sự chuyên đề về sở hữutrí tuệ của tỉnh Nghệ An có nội dung đa dạng,phong phú tập trung vào hoạt động xây dựng,bảo hộ và phát triển thương hiệu của 17 doanhnghiệp và 7 làng nghề, qua đó đã giới thiệuđược thương hiệu có uy tín đang hoạt độngtrên địa bàn tỉnh và cũng là những doanhnghiệp, cơ sở sản xuất triển khai khá tốt tronglĩnh vực sở hữu trí tuệ như Tổng công ty CPVật tư Nông nghiệp Nghệ An, Công ty Sảnxuất Tôn sắt Thép Định Nhàn, Tổng công tyvàng Agirbank Việt Nam, Công ty CP DuyênViệt, Công ty TNHH Văn Minh, Công ty CPDệt may Hoàng Thị Loan, Công ty CP Thựcphẩm sữa TH… Những phóng sự đã phân tíchkhá sâu những kinh nghiệm, bí quyết củadoanh nghiệp trong xây dựng và phát triểnthương hiệu, về đấu tranh chống những hànhvi xâm phạm quyền sở hữu trí tuệ, bảo vệ uytín, lợi ích của doanh nghiệp. Trong đó đặc biệtphản ánh một vấn đề mà hiện nay rất “nóng”đang được dư luận quan tâm đó là vấn đề hànggiả, hàng nhái, hàng kém chất lượng, hàng viphạm quyền sở hữu trí tuệ đang được bán trànlan trên thị trường trong tỉnh. Bên cạnh giớithiệu về hoạt động của các doanh nghiệp,Chương trình đã phản ánh về quá trình xâydựng thương hiệu các đặc sản truyền thống củacác làng nghề như: sản phẩm vịt bầu Quỳ,hương trầm Quỳ Châu, chè Nghệ An, bánh đakẹo lạc Vĩnh Đức, nước mắm Vạn Phần(8).Nghệ An cũng đã chuyển giao thành công kỹthuật cao, công nghệ cao trong lĩnh vực y tế:công nghệ ghép tủy (ghép tế bào gốc)…(9).

Với những tiềm năng và nội dung hoạtđộng KH&CN sâu rộng như vậy, chắc chắnrằng, các cơ quan quản lý nhà nước của tỉnhNghệ An nói chung, các doanh nghiệp, tổchức, cá nhân tham gia vào các phân đoạn thịtrường nói riêng hoàn toàn có thể nắm giữ một

Page 4: Ứng dụng Big Data - ngheandost.gov.vn NCTD_05.pdf · làm thay đổi to lớn cách vận hành truyền thống của xã hội, di trú vào tất cả các ... có phần

Tạp chíKH-CN Nghệ An

SỐ 4/2015 [43]

NGHIÊN CỨU - TRAO ĐỔI

hàng, hàng không, quân sự, y tế - sức khỏe ngày hômnay phần lớn dữ liệu lớn được xử lý trong thời gianthực, xử lý tức thì trước khi chúng được lưu trữ vàocơ sở dữ liệu.

- Variety (Đa dạng chủng loại): Hình thức lưu trữvà chủng loại dữ liệu ngày một đa dạng hơn. Trướcđây chúng ta hay nói đến dữ liệu có cấu trúc thì ngàynay hơn 80% dữ liệu trên thế giới được sinh ra là phicấu trúc (tài liệu, blog, hình ảnh, video, voice...)…

- Veracity (Độ chính xác): Một trong những tínhchất phức tạp nhất của Big Data là độ chính xác củadữ liệu. Bài toán phân tích và loại bỏ dữ liệu thiếuchính xác và nhiễu là một đặc tính vô cùng quan trọngcủa Big Data.

- Value (Giá trị thông tin): Giá trị thông tin làtính chất quan trọng nhất của xu hướng công nghệBig Data. Ở đây chúng ta phải hoạch định đượcnhững giá trị thông tin hữu ích của Big Data cho cácvấn đề, bài toán hoặc mô hình hoạt động mà tahướng tới. Big Data không chỉ đơn thuần là vấn đềkích cỡ và dung lượng của dữ liệu, mà người dùngphải tiếp cận, chọn lọc nguồn dữ liệu, cung cấp thuậttoán tối ưu để giúp máy tính có thể phân tích, xử lývà khai thác thông tin nhằm phục vụ cho mục đíchcủa con người(12).

Việt Nam chúng ta đang ngày càng gia tăng tốc độphát triển và hội nhập với các xu hướng công nghệ thếgiới. Với hơn 30 triệu người dùng internet và hơn 15triệu người dùng Mobile internet làm cho Việt Namđang đứng trước một cơ hội vô cùng lớn về khai thác

cũng có tác dụng, chúng có thể chochúng ta biết những điều mà các dữliệu đúng chưa thể làm được. Ví dụnhư dữ liệu sai có thể cho các nhàphân tích dữ liệu biết cách thức conngười hay sai theo các kiểu như thếnào. Cuộc cách mạng khoa học côngnghệ trong thời kỳ mới không phảinằm ở những chiếc máy tính toán dữliệu mà ở chính dữ liệu và cách màchúng ta sử dụng chúng.

Dữ liệu lớn đánh dấu bước khởi đầu củamột biến đổi lớn. Trong một bài phát biểu củamình, Eric Schmidt - CEO của Google chobiết, năm 2003 thế giới tạo ra 05 Exabyte dữliệu (05 tỷ Gigabyte) thì đến năm 2010, cứ 2ngày thế giới lại tạo ra 05 Exabyte dữ liệu; ướctính trong năm 2015, cứ 10 phút thế giới lại tạora chừng đó dữ liệu(10). Big Data sẽ là công cụthúc đẩy sự phát triển kinh tế - xã hội trongtương lai. Theo ước tính của Gartner, một côngty nghiên cứu và tư vấn về công nghệ hàng đầucủa Mỹ, tới năm 2015, Big Data có thể tạo rathêm 4,4 triệu việc làm trong ngành IT toàncầu và trong 5 năm (2012-2017), thế giới sẽđầu tư 232 tỷ USD cho Big Data. Mô hình“5Vs” - năm tính chất quan trọng - của Gartnerhiện đang được thế giới nói đến như những đặctrưng cơ bản của Big Data, cụ thể là(11):

- Volume (Số lượng lưu trữ): Big Data làtập hợp dữ liệu có dung lượng lưu trữ vượtmức đảm đương của những ứng dụng và côngcụ truyền thống. Big Data đang từng ngày tănglên, và tính đến năm 2012 thì nó có thể nằmtrong khoảng vài chục terabyte cho đến nhiềupetabyte (1 petabyte = 1024 terabyte) chỉ chomột tập hợp dữ liệu mà thôi.

- Velocity (Tốc độ xử lý): Dung lượng giatăng của dữ liệu rất nhanh và tốc độ xử lý đangđạt tới mức độ thời gian thực. Các ứng dụngphổ biến trên lĩnh vực internet, tài chính, ngân

Page 5: Ứng dụng Big Data - ngheandost.gov.vn NCTD_05.pdf · làm thay đổi to lớn cách vận hành truyền thống của xã hội, di trú vào tất cả các ... có phần

chắc chắn sẽ tạo ra một trật tự thế giới hoàn toàn khácvới hiện nay.

Nếu ứng dụng thành công Big Data trong việckhảo sát, đánh giá và phát triển tiềm năng KH&CN,Nghệ An chắc chắn sẽ là tỉnh thành đầu tiên trongcả nước mạnh dạn đi đầu trong một lĩnh vực quantrọng mà thế giới hiện nay đang hết sức quan tâm.Big Data sẽ giúp cho Nghệ An phát triển nghiên cứucơ bản, tạo cơ sở cho việc hình thành một số lĩnhvực KH&CN đa ngành mới, đóng góp tích cực vàoviệc nâng cao năng suất, chất lượng hàng hóa vàdịch vụ; cải thiện năng lực cạnh tranh của doanhnghiệp và nền kinh tế, giúp cho quản lý Nhà nướcvề KH&CN từng bước được đổi mới, hòa chung vàosự phát triển KH&CN của đất nước và thế giới./.

dữ liệu lớn(13). Đặc biệt, trong giai đoạn 2014-2016, xu hướng Mobile và lượng người dùnginternet 3G được dự đoán chắc chắn sẽ tiếp tụctăng mạnh. Việt Nam sẽ là một “mỏ vàng” dữliệu vô cùng lớn cho việc ứng dụng Big Datavà đang là đích ngắm của nhiều nhà cung cấpgiải pháp Big Data như Microsoft, IBM, Ora-cle… Big Data và các công nghệ phân tích cókhả năng làm thay đổi hoàn toàn bộ mặt củacác ngành kinh tế và nghề nghiệp, làm thay đổicách làm việc và tư duy trong việc khai thácvà sử dụng thông tin trong các hoạt độngnghiên cứu, phát triển KH&CN. Thời đại Dữliệu lớn đã hiện diện và chi phối đời sống, cáchthức tư duy của nhân loại và trong tương lai

Chú thích

(1) Xin tham khảo: GilPress, ‘A Very Short History of Big Data’, What’s The Big Data? <http://whatsthebigdata.com/2012/06/06/a-very-short-history-of-big-data/> [accessed 8 April 2015].

(2) Xem: ‘SungardASVoice: Big Data Or Big Brother? - Forbes’ <http://www.forbes.com/sites/sungardas/2015/03/03/big-data-or-big-brother/> [accessed 8 April 2015]; Xem thêm: ‘When Big Data Becomes Big Brother | The Fiscal Times’<http://www.thefiscaltimes.com/Articles/2014/04/09/When-Big-Data-Becomes-Big-Brother> [accessed 8 April 2015].

(3) Xin xem thêm và lưu ý tài liệu tham khảo này yêu cầu trả phí đăng nhập: Jeremy Ginsberg and others, ‘Detecting InfluenzaEpidemics Using Search Engine Query Data’, Nature, 457 (2009), 1012–14 <http://dx.doi.org/10.1038/nature07634>.

(4) Idem.(5) Xin tham khảo: ‘Big-Data Applications in the Government Sector | March 2014 | Communications of the ACM’

<http://cacm.acm.org/magazines/2014/3/172509-big-data-applications-in-the-government-sector/abstract> [accessed 8April 2015]; ‘Big-Data Applications in the Government Sector | March 2014 | Communications of the ACM’<http://cacm.acm.org/magazines/2014/3/172509-big-data-applications-in-the-government-sector/abstract> [accessed 8April 2015]; ‘Big Government Is Getting In The Way Of Big Data | FiveThirtyEight’ <http://fivethirtyeight.com/fea-tures/big-government-is-getting-in-the-way-of-big-data/> [accessed 8 April 2015].

(6) Sức khỏe và Đời sống, ‘Tình Nào Có Diện Tích Lớn Nhất Việt Nam?’, Khoa Học Vui - Kiến Thức Hay<http://www.khoahocvui.info/2014/12/tinh-nao-co-dien-tich-lon-nhat-viet-nam.html> [accessed 8 April 2015].

(7) ‘Thông Tin Tỉnh Thành’ <http://www.chinhphu.vn/portal/page/portal/chinhphu/cactinhvathanhpho/tinhnghean/thongtintinhthanh?view=introduction&provinceId=1368> [accessed 5 April 2015].

(8) ‘Sở Khoa Học và Công Nghệ Nghệ An’ <http://www.ngheandost.gov.vn/news/ar13358_ Hieu_qua_tu_mot_chuong_trinh_truyen_thong_khoa_hoc_cong_nghe_.aspx> [accessed 28 March 2015].

(9) ‘Sở Khoa Học và Công Nghệ Nghệ An’ <http://www.ngheandost.gov.vn/news/ar14356_ Hoi_nghi_tong_ket_hoat_dong_KHCN_nam_2014_va_trien_khai_nhiem_vu_nam_2015.aspx> [accessed 26 March 2015].

(10) Xem toàn bộ video bài phát biểu này tại : ‘Google’s Eric Schmidt on 2014: “Big Data” Will Be Everywhere’<http://www.neowin.net/news/googles-eric-schmidt-on-2014-big-data-will-be-everywhere> [accessed 8 April 2015].

(11) Xem thêm: ‘Gartner’s Big Data Definition Consists of Three Parts, Not to Be Confused with Three “V”s’, Forbes<http://www.forbes.com/sites/gartnergroup/2013/03/27/gartners-big-data-definition-consists-of-three-parts-not-to-be-confused-with-three-vs/> [accessed 8 April 2015].

(12) Xem thêm: ‘Big Data/Analytics Là Gì? Ứng Dụng Dữ Liệu Lớn Trên Thế Giới và Việt Nam 2014 | Vietnam’sDigital Marketing Technology and Views on Data-Driven Advertising, AdNetwork, Ad Server, Mobile Advertising’<http://dinhledat.com/data-driven-marketing/big-dataanalytics-la-gi-ung-dung-du-lieu-lon-tren-the-gioi-va-viet-nam-2014/> [accessed 8 April 2015].

(13) Xem thêm: ‘Thống Kê Internet | Trung Tâm Internet Việt Nam (VNNIC)’ <http://www.thongkeinternet.vn/#3>[accessed 8 April 2015].

NGHIÊN CỨU - TRAO ĐỔI

[44]SỐ 4/2015KH-CN Nghệ AnTạp chí