Bạn gồm biết rằng mang lại năm 2025, chúng ta sẽ bắt buộc xử lý 175 zettabyte dữ liệu đáng kinh ngạc trên toàn cầu1? trong kỷ nguyên dựa vào dữ liệu này, vấn đề học Lập trình R là chìa khóa cho những nhà nghiên cứu và phân tích. Họ đề nghị phân tích, trực quan liêu hóa và nắm rõ dữ liệu phức tạp. Gợi ý này đã cung cấp cho chính mình các kĩ năng và khí cụ để biến một lập trình sẵn viên R giỏi. Nó để giúp đỡ bạn gửi ra đông đảo hiểu biết dựa trên dữ liệu trong phân tích của mình.

Bạn đang xem: Nghiên cứu r&d là gì


Giới thiệu về thiết kế R cho nghiên cứu và phân tích vào năm 2024

Khi chúng ta định phía bối cảnh dựa trên dữ liệu vào khoảng thời gian 2024, lập trình sẵn R liên tục là một quy định không thể thiếu so với các nhà phân tích ở nhiều nghành nghề khác nhau. Kỹ năng thống kê táo tợn mẽ, hệ sinh thái xanh gói mở rộng và xã hội sôi động khiến nó đổi thay lựa lựa chọn lý tưởng nhằm phân tích cùng trực quan lại hóa dữ liệu tinh vi trong toàn cảnh nghiên cứu.


“R không chỉ có là ngữ điệu lập trình thống kê; sẽ là cửa ngõ dẫn đến nghiên cứu rất có thể tái chế tạo ra và tò mò dựa bên trên dữ liệu.” – Hadley Wickham, Nhà công nghệ trưởng trên RStudio

Hướng dẫn này nhằm mục đích mục đích cung ứng cho những nhà nghiên cứu và phân tích những đọc biết mới nhất, các phương thức thực hành rất tốt và những kỹ thuật nâng cao để tận dụng R trong các bước phân tích của họ. Mặc dù bạn là người tiêu dùng R dày dạn kinh nghiệm tay nghề hay mới bắt đầu hành trình, bài toán nắm vững những khái niệm này sẽ cải thiện đáng kể tài năng nghiên cứu giúp của bạn.


Thông tin chi tiết chính

Theo Chỉ số TIOBE năm 2023, R đã duy trì vị trí của mình trong 10 ngôn ngữ lập trình sản phẩm đầu, với sự ngày càng tăng đáng đề cập trong việc vận dụng giữa các nhà nghiên cứu và phân tích hàn lâm với nhà khoa học dữ liệu.


Tại sao R đến Phân tích Nghiên cứu?

R cung cấp một số điểm mạnh khiến nó quánh biệt tương xứng để đối chiếu nghiên cứu:

Năng lực thống kê: hỗ trợ tích hợp mang lại các phương thức thống kê nâng cấp và thuật toán học tập máy. Khả năng tái lập: Tạo đk cho nghiên cứu có thể tái tạo thông qua phân tích dựa vào tập lệnh và những công cụ lập trình dễ hiểu như R Markdown. Khả năng trực quan: những thư viện trực quan lại hóa dữ liệu khỏe mạnh như ggplot2 để chế tạo ra đồ họa chất lượng xuất bản. Khả năng mở rộng: Một hệ sinh thái rộng lớn gồm những gói giành cho các phân tích chăm biệt bên trên nhiều nghành nghiên cứu vớt khác nhau. Mã nguồn mở: sử dụng miễn tầm giá và liên tiếp được cách tân bởi xã hội các nhà phân tích và cải tiến và phát triển toàn cầu.

Sự phổ biến của R vào các lĩnh vực nghiên cứu


Kỹ năng R cần thiết cho những nhà phân tích vào năm 2024

Để sử dụng kết quả R đến phân tích nghiên cứu, hãy triệu tập vào việc nắm vững các nghành chính sau:

1. Thao tác làm việc dữ liệu với gọn gàng gàng

Bộ sưu tập những gói gọn gàng gàng, đặc biệt là dplyr cùng gọn gàng, đã trở thành công cầm cố tiêu chuẩn chỉnh để làm việc dữ liệu vào R.


library(tidyverse)# Example of data manipulationresearch_data %>%filter(year == 2024) %>%group_by(category) %>%summarize(mean_value = mean(value, na.rm = TRUE))

2. Kỹ thuật tưởng tượng nâng cao

Việc nắm vững ggplot2 nhằm tạo những hình ảnh trực quan lại phức tạp, sẵn sàng chuẩn bị xuất bạn dạng là cực kỳ quan trọng.


ggplot(research_data, aes(x = variable1, y = variable2, màu sắc = category)) +geom_point() +geom_smooth(method = "lm") +facet_wrap(~year) +theme_minimal() +labs(title = "Research Outcomes by Category and Year")

3. Mô hình thống kê và học máy

Tận dụng kĩ năng thống kê của R để kiểm tra giả thuyết, đối chiếu hồi quy và học máy.


# Linear Mixed-Effects Modellibrary(lme4)model

4. Nghiên cứu rất có thể tái chế tác với R Markdown

Tích vừa lòng mã, tác dụng và tường thuật bằng R Markdown để sở hữu các report nghiên cứu hoàn toàn có thể tái tạo.


Mẹo

Sử dụng R Markdown để tạo báo cáo động auto cập nhật khi tài liệu hoặc phân tích của bạn thay đổi, đảm bảo tính đồng bộ giữa mã và report cuối cùng của bạn.


Kỹ thuật R nâng cao cho nghiên cứu

1. Tính toán song tuy vậy để phân tích quy mô lớn

Tận dụng tài năng xử lý tuy nhiên song để xử lý những tập dữ liệu lớn và đo lường phức tạp.


library(parallel)library(foreach)library(do
Parallel)register
Do
Parallel(cores = detect
Cores() - 1)results

2. đối chiếu Bayes với Stan

tiến hành các mô hình Bayes bằng gói rstan để suy luận thống kê phức tạp.


library(rstan)stan_model

3. Ứng dụng web can hệ với Shiny

Tạo những ứng dụng web hệ trọng để giới thiệu hiệu quả nghiên cứu của người sử dụng một bí quyết linh hoạt.


library(shiny)ui

Các phương thức thực hành rất tốt cho R trong phân tích (2024)

Kiểm thẩm tra phiên bản: sử dụng Git để theo dõi các chuyển đổi trong tập lệnh R của người tiêu dùng và cộng tác với các nhà nghiên cứu và phân tích khác. Quản lý gói: sử dụng renv để cai quản các gói dựa vào và đảm bảo khả năng tái tạo ra trên các môi trường thiên nhiên khác nhau. Kiểu mã: vâng lệnh hướng dẫn về phong thái gọn gàng để có mã đồng điệu và dễ đọc. Tối ưu hóa Hiệu suất: Lập làm hồ sơ mã của chúng ta và buổi tối ưu hóa các vận động tính toán chăm sâu bằng cách sử dụng những gói như profvis. Bảo mật dữ liệu: Triển khai những kỹ thuật mã hóa và ẩn danh dữ liệu thích hợp khi xử lý dữ liệu phân tích nhạy cảm. Học liên tục: Luôn cập nhật những cách tân và phát triển R tiên tiến nhất thông qua những tài nguyên như R-blogger và hội nghị RStudio.
"Trong nghiên cứu, độ cụ thể của mã cũng quan trọng đặc biệt như độ ví dụ trong văn bạn dạng của bạn. Cả nhì đều góp phần vào kỹ năng tái sản xuất và ảnh hưởng đến quá trình của bạn." - Jenny Bryan, Kỹ sư ứng dụng tại RStudio

Xu hướng tương lai của R dành riêng cho nghiên cứu

Khi họ nhìn về phía trước, một vài xu hướng đang định hình tương lai của R vào nghiên cứu:

Tích hợp với nền tảng đám mây: tăng tốc sử dụng môi trường xung quanh R dựa trên đám mây nhằm tính toán có thể mở rộng. Mã hóa được hỗ trợ bởi AI: cách tân và phát triển các lao lý AI để cung cấp lập trình R và phân tích thống kê. Khả năng thúc đẩy nâng cao: Tích hợp xuất sắc hơn với các ngôn ngữ và biện pháp khác, nhất là Python và Julia. Gói tên miền siêng dụng: Sự trở nên tân tiến của những gói R có tính trình độ chuyên môn cao dành riêng cho các nghành nghiên cứu vãn thích hợp. Công nuốm trực quan lại được cải tiến: khả năng hiển thị tương tác, nâng cao cho dữ liệu nghiên cứu và phân tích phức tạp.

Nhìn về phía trước

Hệ sinh thái R dự con kiến ​​sẽ liên tục phát triển, tập trung vào việc cải thiện khả năng tái tạo, kĩ năng mở rộng cùng tính dễ dàng sử dụng cho các nhà nghiên cứu thuộc các lĩnh vực.


Kết luận

Việc thành thạo xây dựng R nhằm phân tích nghiên cứu và phân tích vào năm 2024 không chỉ bao hàm việc gọi các tính năng cốt lõi của ngôn từ mà còn tận dụng hệ sinh thái xanh rộng mập gồm các gói và lao lý của nó. Bằng cách tập trung vào thao tác làm việc dữ liệu, trực quan hóa, quy mô thống kê và năng lực tái tạo, những nhà phân tích có thể cải thiện đáng kể unique và ảnh hưởng tác động của công việc của họ.

Hãy hãy nhờ rằng hành trình thống trị R vẫn sẽ diễn ra. Hãy luôn luôn tò mò, liên tưởng với xã hội R và tiếp tục áp dụng những kĩ năng này vào những dự án phân tích của bạn. Khi R tiếp tục phát triển, nó vẫn là một trong những công nuốm vô giá cho các nhà nghiên cứu đang tra cứu cách tò mò những hiểu biết thâm thúy về dữ liệu tinh vi và thừa qua ranh ma giới trong lĩnh vực của họ.


R là một trong những ngôn ngữ mã nguồn mở khỏe khoắn được sử dụng không ít trong tài liệu khoa học, nghiên cứu và học viện. R cung ứng một môi trường thiên nhiên linh hoạt để làm việc với tài liệu và thực hiện các trách nhiệm thống kê2. Nó cũng có thể có một tủ chứa đồ lớn những gói cho các nhiệm vụ phân tích khác nhau2. Ngoại trừ ra, R còn được nghe biết với những số liệu thống kê trẻ khỏe và khả năng lập quy mô đồ họa, khiến nó được những nhà thống kê cùng nhà khoa học dữ liệu yêu thích.3.

Vào năm 2024, biết cách sử dụng R là chìa khóa đối với các nhà phân tích và phân tích. Họ cần được làm việc giỏi với tài liệu phức tạp. Lí giải này sẽ chỉ cho mình những cách tốt nhất để thực hiện R trong nghiên cứu, từ tùy chỉnh môi trường của người sử dụng đến áp dụng các cách thức nâng cao như học máy với mô hình thống kê. Cuối cùng, các bạn sẽ có những năng lực và hình thức để trở nên một thiết kế viên R giỏi. Bạn sẽ có thể gửi ra rất nhiều hiểu biết dựa vào dữ liệu trong nghiên cứu và phân tích của mình.

Các văn bản chính

Hiểu tầm quan trọng của Lập trình R cho phân tích nghiên cứu và phát triển sự nghiệp vào khoảng thời gian 2024.Khám phá tính linh động của R vào thao tác dữ liệu, phân tích thống kê với trực quan lại hóa dữ liệu.Tìm gọi về nhu cầu ngày càng tăng về kỹ năng R trong số ngành không giống nhau, bao gồm chăm sóc sức khỏe, tài chính, cùng công nghệ.Khám phá thực hành giỏi nhất để cấu hình thiết lập Lập trình R môi trường và nắm rõ những loài kiến ​​thức cơ bản về Cú pháp R cùng cấu trúc dữ liệu.Hiểu rõ hơn về các chiến lược kết quả để quá qua những thử thách thường chạm chán trong việc học R cùng trở thành lập và hoạt động trình viên R thành thạo.

Lập trình R là gì và tại sao nó đặc biệt quan trọng vào năm 2024?

R là 1 ngôn ngữ trẻ trung và tràn trề sức khỏe cho phân tích dữ liệu và đo lường và thống kê thống kê. Nó trở nên đặc biệt hơn vào năm 2024 vì kỹ năng xử lý dữ liệu phức tạp và tiến hành phân tích nâng cao4. Những nhà nghiên cứu và phân tích và chuyên viên trong nhiều lĩnh vực nhận thấy giá chỉ trị của chính nó trong câu hỏi làm ví dụ những đọc biết về dữ liệu.

Tính linh động của R trong phân tích cùng trực quan lại hóa dữ liệu

R có không ít gói và công cụ cho các tác vụ dữ liệu4. Thật tuyệt vời nhất cho thao tác dữ liệu, mô hình thống kêvà khiến cho dữ liệu tinh vi trở đề xuất dễ nhìn4. Nó vận động tốt với tương đối nhiều nguồn dữ liệu và giúp người dùng share những phân phát hiện của họ một biện pháp rõ ràng.

Các ngành công nghiệp chủ yếu tận dụng xây dựng R vào thời điểm năm 2024

Vào năm 2024, kỹ năng R là quan trọng trong khoa học, tài chính, học viện, và khu vực công4. Chăm sóc mức độ khỏe, dược phẩmbảo hiểm những công ty có muốn có chuyên viên R cho những nhiệm vụ dữ liệu phức tạp4. R là chìa khóa cho tất cả những người cần gọi và chia sẻ dữ liệu phức tạp.

Nhu cầu đưa ra quyết định dựa trên tài liệu ngày càng tăng, khiến khả năng R trở nên có giá trị hơn vào năm 20244. Thực chất nguồn mở và năng lực tương thích dữ liệu rộng khiến cho nó trở nên một công cụ đặc biệt cho phân tích dữ liệu.

"R là lựa chọn tương xứng cho các chuyên viên đang tìm bí quyết rút ra phần nhiều hiểu biết có ý nghĩa từ dữ liệu của họ, với tính hoạt bát trong thao tác làm việc dữ liệu, mô hình thống kêvà tạo ra những hình hình ảnh trực quan lại phức tạp."

Bắt đầu với R: cấu hình thiết lập môi trường

Để bắt đầu học xây dựng R, trước tiên hãy thiết lập cấu hình Môi trường phát triển tích hợp (IDE). Điều này còn có nghĩa là thiết đặt R và một IDE tuyệt đối hoàn hảo như RStudio. Đây sẽ là nơi chủ yếu để các bạn viết, chạy và khám nghiệm mã R.

Cài để R với RStudio

Bạn có thể tải xuống R miễn tầm giá từ website Mạng tàng trữ R toàn diện (CRAN). RStudio là 1 trong những IDE giúp áp dụng R giỏi hơn bằng phương pháp cung cung cấp giao diện rõ ràng và dễ dàng sử dụng. Lấy RStudio từ trang web chính thức của RStudio. Sau khi thiết lập R với RStudio, bạn đã sẵn sàng tò mò những loài kiến ​​thức cơ phiên bản về R và ban đầu hành trình của mình trong đối chiếu nghiên cứu5.

Tìm hiểu bối cảnh RStudio

Giao diện RStudio có tương đối nhiều phần khác nhau, mỗi phần có trọng trách riêng nhằm giúp quá trình của bạn tốt hơn. Các Bảng tập lệnh là để viết và sửa đổi mã R. Các Bảng điều khiển chất nhận được bạn chạy những lệnh R. Những Bảng tinh chỉnh và điều khiển môi trường hiển thị những biến buổi giao lưu của bạn cùng cấu trúc dữ liệu. Và Bảng vẽ/Trợ giúp/Tệp cung cấp cho chính mình quyền truy vấn vào trực quan hóa, giúp đỡ và thống trị tệp5.

Biết cách thực hiện giao diện RStudio giúp bạn di chuyển trong nhân loại R giỏi hơn. Nó có thể chấp nhận được bạn sử dụng ngôn từ một cách vừa đủ cho phân tích nghiên cứu. Với không khí làm việc gọn gàng và dễ dàng sử dụng, chúng ta cũng có thể tập trung vào công việc và bước đầu trở thành một thiết kế viên R lành nghề5.

"RStudio là công cụ đổi khác cuộc chơi giành riêng cho các lập trình sẵn viên R, cung cấp không gian thao tác liền mạch và bao gồm thể thiết lập cấu hình để cải thiện năng suất với hiệu quả."

Khi R cùng RStudio được thiết lập, bạn có những công rứa để bước đầu học R để phân tích nghiên cứu. Tiếp theo, chúng ta sẽ mày mò sâu rộng về đầy đủ điều cơ bạn dạng của R cùng xem nó được sử dụng ra làm sao trong so sánh dữ liệu và hình dung6.

Nguyên tắc cơ bản của thiết kế R

Để sử dụng R để phân tích nghiên cứu, chúng tôi bước đầu với hồ hết điều cơ bạn dạng về nó. Cú pháp của R rất thuận lợi và mang đến phép bọn họ thực hiện các tác vụ tài liệu một giải pháp dễ dàng7. Nó có sức khỏe cấu trúc dữ liệu Lượt mê say vectơ, ma trận, khung dữ liệudanh sách để tổ chức triển khai dữ liệu7.

Xem thêm: Sự Kiện Y2K Năm 2000 - 24 Năm Trước, Một Thảm Họa Máy Tính Suýt Xảy Ra

Cú pháp và cấu trúc dữ liệu R

Cú pháp của R dễ dàng đọc với viết, góp mã của shop chúng tôi hiệu quả với dễ theo kịp7. Biết phương pháp sử dụng cú pháp cơ bạn dạng cho phép shop chúng tôi sử dụng R một cách vừa đủ cho phân tích của mình7. Cấu trúc dữ liệu vào R là khóa, mỗi cấu trúc có cách thực hiện riêng. Vectơ lưu trữ các mảng cùng các loại dữ liệu. Ma trận với khung dữ liệu giúp cửa hàng chúng tôi tổ chức với phân tích các bảng. Chức năng chúng ta hãy lưu lại trữ những loại dữ liệu khác nhau, tạo thành các cấu tạo dữ liệu phức tạp cho phân tích của bọn chúng ta7.

Viết mã R hiệu quả

Biết phương pháp viết mã R hiệu quả là chiếc chìa khóa để phân tích phân tích tốt. R có những công nuốm như vectơ hóa, điều kiệnchức năng để triển khai cho công việc của cửa hàng chúng tôi nhanh hơn7. Vector hóa mang lại phép chúng ta làm câu hỏi trên những mảng tài liệu cùng một lúc, khiến cho mã của họ nhanh rộng và đơn giản và dễ dàng hơn7. Học tập cách sử dụng điều kiện, vòngchức năng giúp shop chúng tôi viết tập lệnh R xuất sắc hơn cho các tác vụ tài liệu lớn7.

R là một trong chương trình phân tích tài liệu mã nguồn mở được cải tiến và phát triển bởi những nhà thống kê cùng được sử dụng rộng rãi trong những trường đại học trên thay giới. Ứng dụng ngữ điệu R vào huấn luyện và nghiên cứu cung ứng thêm mang lại nhà nghiên cứu và phân tích một lựa chọn trẻ trung và tràn đầy năng lượng và tiết kiệm. Phiên bản thân R hoàn toàn có thể tạo nên những ấn phẩm trực quan tài liệu có unique cao, liên tưởng đa nhiệm và góp phần mài sắc tư duy phân tích cho nhà phân tích khoa học tập xã hội, tương xứng với bối cảnh cải cách và phát triển của cuộc giải pháp mạng 4.0 hiện tại nay.

Từ khóa: R, ngôn từ lập trình, so với dữ liệu, trực quan lại dữ liệu, buôn bản hội học

1.MỞ ĐẦU

Khoa học xã hội nói tầm thường và thôn hội học tập (sociology) thích hợp là phần nhiều ngành khoa học nghiên cứu và phân tích khía cạnh thôn hội của xã hội chủng loại người bằng cách phân các loại chúng thành những khuôn mẫu mã (parttern). Đơn cử như xóm hội học, là nghành nghề dịch vụ không nghiên cứu "con bạn cá nhân", khách hàng thể nhưng ngành công nghệ này tiếp cận là những "con tín đồ xã hội", với xét trên một số trong những tiêu chí rõ ràng thì các cá thể ấy đã là thành viên của một hay những nhóm xã hội khác nhau.

Kế thừa thành tựu trong phương thức nghiên cứu giúp của kỹ thuật tự nhiên, tiếp cận tài liệu trên số lượng lớn dần biến một đặc thù mà ngành thôn hội học tập sở hữu. Đáp ứng yêu cầu ấy, môn Thống kê xóm hội (social statistic) ra đời như một lĩnh vực liên ngành giữa Xã hội học và công nghệ Thống kê. Thống kê lại trở thành công cụ hữu ích và phân tích dữ liệu trở thành kỹ năng quan trọng đặc biệt mà những nhà làng mạc hội học áp dụng trong thừa trình mày mò xã hội của mình. Có thể nói, “thiếu khoa học thống kê, nhà nhà nghiên cứu xã hội học tập chẳng không giống nhào một người mù mò mẫm trong căn nhà kho tối đen để tìm con mèo black mà bao gồm khi nó đã không còn ở trong các số đó nữa” <1, tr. 15>.

Sự phát triển của khoa học kỹ thuật tiến bộ trong cố gắng kỷ XX sẽ giúp những nhà kỹ thuật xã hội tự bỏ phương pháp tính toán bằng tay thủ công vốn khiến nhiều tranh cãi xung đột và kém kết quả để tiến tới việc quản lý các hệ thống máy tính hiện nay đại. Mặc dù vì một số tại sao khách quan khiến xã hội học tập được du nhập muộn màng, song cũng nhờ nắm mà việt nam là các quốc gia nằm trong xu ráng được hưởng lợi từ các thành quả công nghệ kể trên.

Từ trong thời hạn 1985 cho nay, những nhà công nghệ xã hội nói thông thường và làng mạc hội học dành riêng tại vn đã có tác dụng quen với các chương trình như IBM SPSS, SAS, STATA, Eview, Excel (trong nội dung bài viết này vẫn gọi phổ biến là các phần mềm thương mại)… với các ưu gắng khác nhau. Trường hợp như STATA với Eview gần như chiếm lĩnh thị phần nghiên cứu kinh tế tài chính lượng (econometric), thì SPSS là ứng dụng thống kê làng hội rất thông dụng tại các trường đại học và viện nghiên cứu. Tất cả sv ngành buôn bản hội học tập ở nước ta đều được học tập qua ứng dụng SPSS với học phần về Thống kê làng hội học.

*

Hình 1: Một số chữ tín nổi tiêng trong nghành nghề phân tích tài liệu hiện nay

Tuy nhiên, bối cảnh trở nên tân tiến của cách mạng công nghiệp 4.0 với sự bùng nổ của dữ liệu hiện giờ đang tạo thành một hệ lụy trong việc phân tích.

Dữ liệu mập (big data) đòi hỏi cần phải có các chương trình tương hợp để phân tích. Dữ liệu dồi dào để cho việc thu thập thông tin được sút bớt, phần lớn các bước được đưa sang việc triệu tập khai phá thông tin (explore), nắm bắt tri thức, diễn giải tài liệu nhằm góp phần đưa ra phần đông quyết định đúng đắn hơn. Hình như là năng lực trực quan tài liệu (data visualization) với các biểu đồ gia dụng có quality tương đối tốt cùng năng lượng việc tổ chức dữ liệu (data manipulation) hạn chế vô hình dung chung dẫn cho việc người dùng phải phối hợp từ 2 – 3 phần mềm một lúc, đặt nặng nề tính qui định lên song vai ở trong phòng nghiên cứu trong những lúc vai trò chính của mình là bốn duy cùng phản biện thôn hội.

Một yếu hèn tố quan trọng đặc biệt nhưng lại thường bị xem vơi tại vn là tính phiên bản quyền áp dụng (licence) của phần mềm. Excel cùng SPSS là hai phần mềm được thực hiện trái phép nhiều vì tính phổ biến của chúng. Đa số phiên phiên bản SPSS và Excel đang được sử bởi các giảng viên, sinh viên, nhân viên nghiên cứu hiện thời đều là lịch trình đã được mở khóa (crack). Việc áp dụng trái phép các phần mềm này là câu hỏi làm hoàn toàn sai trái cùng vi phạm pháp luật về quyền cài đặt trí tuệ. Tất nhiên, việc phạm luật kể trên cũng có thể có lý vì của nó. ở bên cạnh ý thức phải chăng trong đạo đức nghiên cứu khoa học, thì giá cả cho một năm sử dụng của SPSS hoàn toàn có thể lên cho hơn 5.000$, STATA là hơn 2.000$ <4>, những phiên phiên bản áp dụng đến sinh viên cũng trên dưới 50$. Số tiền này ở ngoài năng lực của phần nhiều các ngôi trường đại học, viện nghiên cứu và phân tích và độc nhất là sv của nước ta hiện nay.

Đâu là câu trả lời cho câu hỏi phân tích xử lý dữ liệu có trọng lượng lớn, đạt độ đúng mực cao, sở hữu kĩ năng trực quan tài liệu linh hoạt, có thể thao tác ở các nền tảng, có túi tiền hợp lý và đặc biệt hơn cả là góp thêm phần mài sắc bốn duy phân tích trong phòng nghiên cứu vãn khi sử dụng thống kê như một phương tiện tìm hiểu xã hội? có rất nhiều phương án cho câu hỏi trên, mà mục đích của bài viết này là khuyến cáo một chiếc tên trong các phương án ấy: Ngôn ngữ R

2. NỘI DUNG

2.1. Ngôn từ R là gì?

R là một trong ngôn ngữ lập trình sẵn (programming language) được thiết kế với cho mục đích phân tích dữ liệu. Không giống với các ứng dụng thương mại được liệt kê ở trên, R là một trong những chương trình gồm mã nguồn mở (open source) vị đó, R trọn vẹn miễn tầm giá và được cách tân và phát triển bởi team ngũ những nhà phân tích dữ liệu trên toàn cụ giới. Với mục đích xây cất giành riêng mang lại phân tích dữ liệu nên R bao gồm hiệu năng khỏe mạnh trong bài toán tổ chức, khái phá, phân tích với trực quan dữ liệu.

Tác giả của ngữ điệu R là Ross Ihaka và Robert Gentleman trên Đại học Auckland (New Zealand). Với nhu cầu muốn có một lịch trình phân tích dữ liệu hiệu quả và đúng đắn hơn các ứng dụng thương mại, dựa trên ngữ điệu S và công tác S-PLUS vốn đang khả phổ biến vào thời điểm ấy hai nhà công nghệ của Đại học tập Auckland đã tạo nên R. Tuy nhiên, tín đồ nhìn ra tiềm năng của ngôn từ này và mong muốn chúng được chia sẻ công khai đến toàn trái đất lại đó là Martin Mächler. Ông vẫn thuyết phục Ross Ihaka cùng Robert Gentleman là miễn chi phí và chia sẻ mã mối cung cấp của ngôn ngữ R để cho cộng đồng thống kê toàn trái đất cùng phát triển nó từ năm 1995 <6, tr. 18>.

*

Hình 2: Giao diện thiết yếu của lịch trình R-Studio, dùng để làm chạy ngôn ngữ R

Ngoài vị vậy của một công tác miễn phí, R sở hữu một trong những tính năng quan lại trọng hoàn toàn có thể thay cố gắng các phần mềm thương mại không giống trong nghành nghề phân tích dữ liệu.

2.2. Các thế mạnh mẽ của R trong đối chiếu dữ liệu

2.2.1. Trở nên tân tiến tư duy nghiên cứu khoa học tập một cách hệ thống

R là phương tiện đi lại giúp mài sắc tư duy phân tích, vì theo một trong những nhận xét tiêu chí quan trọng đặc biệt nhất khi áp dụng R là người tiêu dùng phải biết chính xác điều mình đang triển khai là gì <6, tr. 22> . Cùng với các phần mềm có hình ảnh kéo thả (drop và drag) như SPSS tuyệt Excel, người dùng có thể bắt chước các làm việc kỹ thuật bằng phương pháp ghi nhớ một giải pháp cơ học tập vị trí những nút bấm, dựa vào vậy một người không tồn tại hiểu biết những về thống kê hay máy tính xách tay vẫn có thể thực hiện được các thao tác làm việc trên những ứng dụng này. Tuy điểm mạnh này tạo thành ra cơ hội để những người không có rất nhiều nền tảng đo lường như xã hội học tiếp cận tới phân tích tài liệu một phương pháp dễ dàng, tuy vậy về lâu bền hơn việc sử dụng các trình thống kê lại theo thói quen đề cập trên đã tạo nên một nạm hệ người cần sử dụng không thực sự hiểu về điều nhưng mình đang có tác dụng <5>.

Việc so với thống kê với R góp rũ bỏ trọn vẹn thói quen thuộc thiếu khoa học này của fan dùng. Trước hết vày R là một trong những ngôn ngữ dựa trên những hàm, tức là mọi hoạt động vui chơi của R đầy đủ được thực hiện bằng cách gọi hàm <1, tr. 31>. Bất cứ một làm việc tính toàn nào khi tiến hành với R gần như được triển khai bởi những câu lệnh được cấu trúc bởi hệ thống cú pháp (syntax) chặt chẽ. Các hàm số (argument) và tham số (parameter) được viết ra đều phải sở hữu lý bởi vì của chúng và ship hàng cho nhu cầu đo lường và thống kê của tín đồ dùng. Chỉ một cam kết tự để sai vị trí sẽ khiến cho tất cả chương trình ko hoạt động. Nhờ yếu tố nghiêm ngặt này nhưng tính cẩn thận, sâu sắc và có nhiệm vụ của người làm nghiên cứu cũng biến thành được tăng lên.

*

Hình 3: Câu lệnh đầu tiên thường được gõ theo truyền thống lâu đời của giới IT

R cũng là phương tiện rèn luyện tứ duy so sánh theo hệ thống, bởi phân tích khoa học là 1 chuỗi các vận động logic được kết nối với nhau theo đa số quy định ngặt nghèo nhằm tạo ra tri thức có chức năng trả lời cho câu hỏi về trái đất và thôn hội. Vấn đề học môn Thống kê xóm hội học cùng SPSS tại các trường đại học hiện thời chưa tạo thành được thói quen công nghệ này mang đến sinh viên. Khảo sát các giáo trình huấn luyện thống kê hiện thời cho thấy chương trình còn nặng tính toán lý thuyết và hướng dẫn cho những người học bắt chước làm việc kỹ thuật hơn là năng lực tư duy phân tích xuyên thấu theo một hệ thống. Ngược lại, bởi vì tính cụ thể và hệ thống đặc trưng, việc thực hiện R trong đối chiếu dữ liệu để giúp người học rèn luyện được tính vâng lệnh quy trình tiến hành một dự án nghiên cứu và phân tích một cách nghiêm ngặt hơn.

Một dự án công trình phân tích trên R được triển khai vừa đủ 5 cách từ (1) – nhập dữ liệu, (2) – tổ chức triển khai dữ liệu, (3) – khai thác dữ liệu, (4) – phân tích dữ liệu, (5) – diễn giải dữ liệu <2, tr. Ix – x>. Người dùng cần cố chắc tất cả quá trình để chế tạo ra công dụng phân tích. Không giống với bài toán kết hợp đa phần mềm trước đấy, các thao tác này đều rất có thể được tiến hành trên R.

2.2.2. Lợi thế cạnh tranh trong phân khúc thị phần phân tích dữ liệu

R là trình phân tích trọn vẹn miễn phí, tuy vậy miễn tổn phí không đi thuộc với unique thấp <3, tr. 6>. đối chiếu với đa số mềm yêu mến mại trẻ khỏe như SPSS, SAS, STATA, Eview, Excel,… R vẫn sở hữu một trong những lợi thế đối đầu nhất định.

Một khi đã thống trị R, thi thoảng khi người dùng có xu hướng muốn trở lại các ứng dụng thương mại

Lợi nắm của R được biểu hiện qua nhị chỉ báo: nhiều nhiệm với linh hoạt.

Về tính nhiều nhiệm: Trước hết, ngôn ngữ R hoàn toàn có thể thực hiện tất cả các trọng trách phân tích tài liệu trong ngành làng hội học mà các ứng dụng thương mại khác có thể làm. Việc giám sát các đại lượng thống kê miêu tả như vừa phải (mean), trung vị (median), khoảng tầm tứ phân vị (quarter), phân phối chuẩn (normal distribution); việc thực thi chọn mẫu (sampling), mô phỏng tài liệu (data simulation); các phân tích thống kê cơ phiên bản như: kiểm nghiệm Chi-sq, kiểm định t-test, so với phương không nên (analyse of variance), phân tích đối sánh tương quan (correlation), so với hồi quy tuyến đường tính (linear regression), hồi quy logistic (logistic regression), chu chỉnh độ tin cậy của thang đo (cronback alpha), phân tích yếu tố (factor analyze)… đều hoàn toàn có thể thực hiện nay một cách lập cập và chính xác trên R với 1 vài loại lệnh.

Do đó, vấn đề lựa lựa chọn R là luật pháp phân tích, người tiêu dùng hoàn toàn hoàn toàn có thể tin tưởng vào những tính năng so với của R.

*

Hình 4: R rất có thể thức hiện những trình chỉnh sửa dữ liệu rất đáng nể

Kế đến, ngôn từ R có thể thực hiện tại cả những trọng trách phân tích dữ liệu trong ngành buôn bản hội học mà một số phần mềm thương mại hòa bình chưa thể làm, độc nhất vô nhị là việc biên tập bộ tài liệu tiêu chuẩn chỉnh (tidy data). Dữ liệu chuẩn, theo ý kiến của Hadley Wickham - là khi mỗi phát triển thành số được trình diễn theo từng cột, mỗi quan giáp được xếp theo từng hàng với mỗi quý giá thì nằm gọn gàng trong một ô <2, tr. 149>. Hai ứng dụng trẻ khỏe nhất của R vào trường đúng theo này là chức năng tổ chức triển khai (data manipulation) cùng trực quan dữ liệu (data visualization). Thao tác làm việc tổ chức dữ liệu bao gồm các bước: (1) - Nhập liệu, (2) - có tác dụng sạch, (3) - chuyển hóa cùng (4) lưu lại trữ. Xuất phát từ 1 khối thông tin sơ khai bước đầu, tổ chức dữ liệu thành một hệ thống chuẩn phục vụ cho quá trình phân tích của dòng sản phẩm tính rất có thể được tiến hành nếu người tiêu dùng nắm vững vàng các phần mềm dạng bảng như Excel, Access với nhất là SQL.

Theo giải pháp làm thông thường, sau thời điểm đã tất cả bộ dữ liệu chuẩn chỉnh người sử dụng đưa các dữ liệu này vào một phần mềm đối chiếu như SPSS, SAS, STATA để tiến hành phân tích. Hiệu quả phân tích có thể được trực quan lại hóa thành những biểu thiết bị hoặc bảng dữ liệu ship hàng cho mục tiêu giao tiếp. Phần nhiều các ứng dụng kể bên trên không có công dụng tạo ra các biểu thiết bị có rất tốt cũng như khả năng chuyển đổi linh hoạt những tham số phía bên trong biểu đồ. Vì chưng đó, người tiêu dùng có kiến thức chuyển tài liệu vào Excel bởi ứng dụng này rất có thể trực quan lại khá tốt các đối chiếu nhị biến (binary variables), nhưng giới hạn của Excel là chỉ có thể trình bày tối đa 3 vươn lên là số bên trên một biểu thiết bị và gần như không thể gửi hóa đúng đắn dữ liệu trên các bản đồ địa lý.

Nhìn xa hơn, nghiên cứu và phân tích mạng lưới xóm hội là 1 trong những thế mạnh của xã hội học, mặc dù khi đề nghị thể hiện những sơ đồ dùng mạng lưới làng hội (social network diagram) và giám sát các hệ số cố kết của mạng lưới thì số đông không có ứng dụng thương mại nào đề cập trên rất có thể thực hiện ngay được. Ngược lại, R là phương tiện có thể làm được hầu như yêu cầu trên.

Trên thực tế, tất cả các biểu đồ mà lại giới phân tích tài liệu sử dụng hiện thời đều hoàn toàn có thể được vẽ trên R <7>.

Về tính linh hoạt: một trong các các tiêu chuẩn giúp các phần mềm được nhận xét cao trong bối cảnh thế giới hóa như bây giờ chính là khả năng thích nghi của chúng. R là một chương trình có khả năng thích nghi cao bởi tính linh hoạt của chúng.

(1) - Tính hoạt bát trong sử dụng. Như đã trình bày ở trên, R là một trong những ngôn ngữ (language), vì chưng đó, bạn dùng có thể thực hiện so với trên bất kể nền tảng (platform) nào mà không hoàn toàn bị phụ thuộc vào việc cài đặt chương trình đồ vật tính. Sau khi thiết đặt ngôn ngữ R, người dùng sẽ yêu cầu thêm một IDE (“Integrated Development Environment”: môi trường xung quanh phát triển tích hợp) riêng mang lại R. Năm 2010, xã hội phát triển R cho trình làng R Studio (hình ảnh ở trên), một IDE hỗ trợ việc triển khai phân tích bên trên R diễn ra được dễ dãi và hối hả hơn.

*

Hình 5: Phân tích và trực quan tiền hóa tài liệu là lợi thế lớn độc nhất vô nhị của R

Điều này góp R trở nên gần gũi với người tiêu dùng vốn vẫn quen cùng với giao diện can hệ như Excel, SPSS, SAS hoặc STATA. Tuy nhiên, khác với các phần mềm này người dùng hoàn toàn có thể vận hành R trên những nền tảng online nhưng mà không buộc phải phải thiết lập với sản phẩm công nghệ tính. Jupyter là một trong ứng dụng trực tuyến được cho phép người dùng phân tích dữ liệu với rất nhiều ngôn ngữ so với dữ liệu, trong đó có R. Như vậy, fan dùng có thể sử dụng R khi phải mà không chịu sự phụ thuộc vào việc thiết đặt phần mềm trên máy vi tính vốn mang theo khá nhiều rủi ro ẩn chứa như mã độc hoặc vi khuẩn được lắp kèm trong số chương trình không có phiên bản quyền.

(2) - Tính linh hoạt theo nhu cầu. R trở nên tân tiến dựa trên yêu cầu phân tích của các cá thể hơn là 1 phần mềm tổng đúng theo vượt xa yêu cầu người dùng. Một số trong những tác vụ phân tích dữ liệu không nằm sẵn trong lịch trình mà được gói gọn gàng vào những gói (packages) được lưu trữ trên trang chủ của R <7>. Ví dụ, không hẳn người làm sao cũng mong muốn vẽ sơ đồ vật mạng lưới thôn hội tốt ma trận đối sánh đa biến, cho nên vì thế chương trình tạo thành sơ đồ vật này sẽ không tồn tại sẵn trong R. Người tiêu dùng sẽ gõ lệnh yêu ước R mua gói công tác vẽ sơ thứ mạng lưới về máy cùng kích hoạt để sử dụng. Điều này giúp tiết kiệm bộ nhớ lưu trữ cho máy tính xách tay và yên cầu người dùng buộc phải có nền tảng kiến thức trình độ để lựa chọn mức sử dụng phù hợp.

2.2.3. Tiềm năng cách tân và phát triển bền vững:

Nếu kĩ năng thích nghi cao phát triển thành một ưu thế của R trước bức tranh trái đất hóa thì việc có công dụng tự quản lý là khóa xe để R có tiềm năng cải cách và phát triển một cách bền vững trong bối cảnh cách mạng công nghiệp 4.0 hiện nay nay.

Trước hết, người sử dụng R có thời cơ tồn tại một cách hợp pháp. Như vẫn phân tích sống trên việc thực hiện các ứng dụng không chứng tỏ được quyền cài đặt là vi phi pháp luật về quyền thiết lập trí tuệ. Một trong số lý do khiến cho người dùng phạm luật điều này chính là do ngân sách chi tiêu mua bạn dạng quyền các phần mềm thương mại thừa cao. Bởi vì đó, bài toán sử dụng ứng dụng miễn phí có mã nguồn mở như R rước lại thời cơ cho giới học thuật được tiếp cận với trình phân tích thời thượng một cách hoàn toàn hợp pháp.

*

Hình 6: R được cách tân và phát triển bởi xã hội các bên phân tích dữ liệu chuyên nghiệp

Kế đến, ngôn ngữ R có chức năng tự vạc triển. Không giống với các phần mềm thương mại, R được phát triển bởi một xã hội các chuyên viên phân tích dữ liệu, những lập trình viên và chuyên viên thống kê bên trên toàn nắm giới; nhớ kia R được trở nên tân tiến và cập nhật mỗi ngày. Không tồn tại một tổ chức nào hoàn toàn sở hữu R nước ngoài trừ bài toán vinh danh những người dân đã góp thêm phần phát triển nó trở thành một trong các những cộng đồng phát triển nhanh trên thay giới.

Ở một mắt nhìn khác, R là ước nối link giữa công nghệ với doanh nghiệp. Đối với giới học tập thuật, R là phương tiện để những nhà thôn hội học hiện nay đại bước chân vào lĩnh vực nghiên cứu vớt liên ngành như công nghệ xã hội thống kê giám sát (computational social sciences - CSS), thôn hội học tập số (digital sociology), trắc lượng thôn hội (social metric)…. Các nghành nghề này chỉ trở nên tân tiến khi công nghệ tích lũy đủ về kỹ thuật đồ vật tính, sự dâng lên của big data và mức phổ biến của mạng xã hội. Dựa vào đó, các nhà làng hội học hoàn toàn có thể mở rộng năng lực tiếp cận nghiên cứu của bản thân không chỉ trong làng mạc hội thực mà còn các cả xóm hội ảo bên trên mạng internet.

Với kỹ năng trực tiếp thao tác với các cơ sở dữ liệu trực tuyến, R đã dần vươn lên là xu cố gắng trong thời đại bí quyết mạng công nghiệp 4.0. Tự khuôn khổ các viện nghiên cứu và phân tích và ngôi trường đại học, R “lấn sân” vào những nền công nghiệp cùng doanh nghiệp, tiếp cận cho tới machine learning, công nghệ khai phá dữ liệu và xử lý dữ liệu lớn <6, tr. 18>. Hiện nay nay, R còn được tích vừa lòng vào các chương trình phân tích dữ liệu đang được trở nên tân tiến như power BI giỏi Google Data Studio; cơ chế quản lý và vận hành mở khiến R có thể liên kết với những trình phân tích dữ liệu khác như Python, Java, GIS tốt SQL một phương pháp nhanh chóng. Tất cả điều này tạo thành lợi cầm cố kết nối khỏe mạnh giữa nhà nghiên cứu với tài liệu trên nhân loại thông qua R.

Sau cùng, nhưng không hề kém phần đặc biệt - thống trị R là đi đầu xu thế cải tiến và phát triển của buôn bản hội với gia tăng thời cơ có được thu nhập cao từ thị trường lao động chất lượng cao. Khi thị phần của những người biết thực hiện SPSS bị bão hòa cùng đang giảm xuống nhanh chóng, việc thâu tóm một ngôn từ phân tích khỏe mạnh như R đem đến lợi gắng canh tranh cao cho những người học. Kết hợp với ánh mắt xã hội học, tứ duy phản bội biện sâu sắc, năng lực phân tích công dụng và kỹ năng tiếp xúc linh hoạt là các kĩ năng nghề nghiệp mà bất cứ một sinh viên xã hội học nào thì cũng cần được trang bị.

*

Hình 7: Ma trận đối sánh được trực quan lại trên ngôn từ R

Cũng đề nghị kể thêm rằng, việc cai quản R tránh việc hiểu là quá trình biến nhà phân tích xã hội học tập thành thợ thống kê, mà trải qua việc sử dụng ngôn ngữ lập trình R - người học rèn đến mình kĩ năng phân tích, tứ duy hệ thống và nhất là sự kiên trì - rất nhiều đức tính cần phải có của một người làm khoa học.

3. Đề xuất giảng dạy và phân tích với ngôn ngữ R

Dạy cùng học là quy trình tương tác hai chiều, bao hàm hoạt cồn giảng của người thầy với tiếp thu của fan học.

Giáo dục tiến bộ đề cao việc hướng dẫn của bạn thầy và năng lực tự nghiên cứu của người học; phân tích dữ liệu với R là một nghành nghề của xã hội hiện nay đại, do đó việc huấn luyện và giảng dạy R cũng ko nằm ngoài quy dụng cụ trên. Để ship hàng cho việc huấn luyện và đào tạo và nghiên cứu và phân tích khoa học tập với R, công ty chúng tôi đề xuất một trong những nội dung áp dụng cho các bên dạy với học như sau.

3.1. Yêu cầu về phía tín đồ học:

Người học cần tiếp cận R dựa trên nhu cầu và cơ sở kiến thức và kỹ năng chuyên môn, ráng thể:

(1) – tài năng tự học: là yêu cầu cao nhất khi tiếp cận R cùng với tư cách là fan mới bắt đầu, một ngày người học hoàn toàn có thể tự giành ra khoảng tầm 45-60 phút để tập gõ lệnh, cách tốt nhất có thể là thực hành các bài tập thống kê trong sách giáo khoa với R để triển khai quen với câu hỏi gõ code cùng triển khai giải quyết và xử lý bài toán.

(2) – tài năng lập trình trong bốn duy: lập trình không phải là gõ mã lệnh (code) mà là quy trình chuyển hóa dữ liệu đầu vào thành công dụng đầu ra một cách gồm hệ thống; code và gõ code chỉ nên phương tiện cần thiết để thực thi quá trình ấy. Tín đồ học sẽ quan sát nhận dự án công trình phân tích của mình với tư cách là 1 hệ thống ngặt nghèo và xử lý từng bước một cho tới khi đạt được hiệu quả cuối cùng.

(3) - kĩ năng đặt thắc mắc dựa trên kỹ năng và kiến thức chuyên môn: là một kỹ năng đặc trưng mà tín đồ học bắt buộc chú ý. Thắc mắc là một mệnh đề thiếu tín nhiệm được nhà nghiên cứu và phân tích đưa ra nhằm triết lý quá tình kiếm tìm câu trả lời. Câu hỏi nghiên cứu ngày càng tăng khả năng tập trung và đưa ra vạch đích để nhà nghiên cứu hướng đến <2, tr. 82>. R chỉ là phương tiện giúp người học tạm bỏ qua các bước tính toán phức tạp, vị đó, việc đặt ra thắc mắc đúng ra quyết định đến tính hiệu quả khi thực hiện R.

(4) – Khả năng tùy chỉnh các trả thuyết nghiên cứu dựa trên kiến thức và kỹ năng cơ bản về thống kê: R bắt buộc phát huy kĩ năng nếu người tiêu dùng không biết điều mà người ta có nhu cầu phân tích. Kiến thức cơ phiên bản về Thống kê sẽ giúp đỡ người học kim chỉ nan được hiệu quả đầu ra, tự đó áp dụng R nhằm tính toán hiệu quả một cách nhanh chóng. Không hiểu nhiều về thống kê, người tiêu dùng không thể tự tìm mẫm để đưa ra kết quả, vì cùng một bài toán phân tích xuất xắc trực quan tài liệu - R rất có thể được thực hiện theo rất nhiều cách khác nhau.

(5) - kỹ năng đọc phát âm tiếng Anh: các tư liệu về phân tích tài liệu nói bình thường và về R nói riêng chủ yếu được viết bởi tiếng Anh. Trong cả trên R, các hàm số với tham số phân tích; giao diện các IDE của R cũng rất được diễn giải hoàn toàn bằng giờ đồng hồ Anh. Vì đó, bài toán nắm một số thuật ngữ thống kê, phân tích tài liệu và kỹ thuật xã hội bằng tiếng Anh là yêu ước bắt buộc so với người muốn thống trị R.

*

Hình 8: Một bạn dạng đồ dữ liệu tương tác được tạo bởi vì R

3.2. Yêu mong về phía tín đồ dạy:

Người dạy dỗ tiếp cận R dựa trên nhu cầu chuyên môn của fan học, cầm thể:

(1) - Giúp người học nhận ra được ưu vậy của R so với các ứng dụng thương mại khác. Chưa hẳn người học nào cũng tiếp cận một công cụ new bởi lợi ích lớn lao mà nó sẽ mang lại. Trước hết, bạn dạy nên có thể ra tính tương đồng của khí cụ này với các công nắm mà fan học từng làm cho quen trước đây. Biện pháp tiếp cận này giúp người học cảm thấy an ninh hơn khi tiếp cận một điều mới mẻ.

(2) - Giúp fan học tiếp cận R như một ngôn từ lập trình. Đây đó là một trong những trở ngại lớn nhất mà khắp cơ thể học và người dạy cần vượt qua. Người tiêu dùng R sẽ phải gõ những dòng lệnh để chỉ thị cho máy vi tính thực hiện thao tác phân tích thay vì chưng kéo thả khuôn khổ (item) như các ứng dụng trước đây. Hướng dẫn bạn học thao tác từng cách một, núm qua cấu trúc cơ bản của một câu lệnh là các bước trước tiên mà khắp cơ thể dạy và bạn học yêu cầu tiếp thu.

(3) - phối kết hợp vừa dạy lý thuyết thống kê vừa thao tác làm việc trực quan ngay lập tức trên R. Đây là giải pháp hướng dẫn tự trực quan nhộn nhịp đến tứ duy trừu tượng; hướng dẫn làm việc phân tích thống kê cơ phiên bản như khai phá, tổ chức, phân tích và trực quan tiền dữ liệu cần được minh họa ngay sau khoản thời gian phần kim chỉ nan kết thúc. Việc rất có thể đạt được kết quả phân tích chỉ cách một cái lệnh rất có thể được sử dụng như động lực khuyến khích fan học demo sai.

(4) Cuối cùng, thiết lập các package tương xứng dựa với yêu cầu phân tích. Người học cần ý thức được rằng R là 1 chương đa nhiệm nhưng không phải là một bộ máy đa năng. Việc người học gọi được mục đích cần có được của quá trình phân tích dữ liệu được cho phép họ chuyển ra câu hỏi đúng và tập trung tối nhiều vào thao tác tính toán cần thiết để đến ra hiệu quả cuối cùng. Do đó, cài đặt các package tương xứng phục vụ cho việc phân tích với hiểu sâu về nó đặc biệt quan trọng hơn việc cài đặt R một phương pháp thiếu mục tiêu rõ ràng.

3.3. Yêu cầu về phương tiện đi lại kỹ thuật

Để học hành và đào tạo với R, shop chúng tôi đề xuất một trong những phương nhân thể kỹ thuật cần thiết sau: sản phẩm công nghệ tính, mạng Internet, cài đặt chương trình R tuy vậy song phần mềm R Studio, thiết đặt hệ sinh thái xanh “tidyverse”, thông tin tài khoản trên Rpubs, thông tin tài khoản trên Jupyter, một trong những sách xem thêm và cố gắng trở thành thành viên của không nhiều nhất một đội nhóm Phân tích tài liệu có thực hiện R.

Ngoài laptop và mạng internet ra, tất cả đều là sản phẩm miễn phí.

*

Hình 9: Phân tích dữ liệu là một trong những kỹ năng đáng đầu tư nhất hiện tại nay

4. KẾT LUẬN

Sử dụng R một bí quyết thành thạo có thể sẽ là một thách thức lớn đối với các nhà nghiên cứu và phân tích xã hội học tập vốn không có rất nhiều kinh nghiệm vào lập trình và thống kê. Mặc dù các chướng ngại trước mắt hoàn toàn có thể được khắc phục bằng cách xác định rõ các phương thức phân tích thống kê cần thiết trong nghành nghề dịch vụ của mình. Các trở lực có thể trở thành rượu cồn lực nhằm giới kỹ thuật xã hội quá qua khi những tính năng mạnh mẽ của R đã tỏ ra cân xứng với xu núm bùng nổ dữ liệu của cuộc cách mạng công nghiệp lần sản phẩm công nghệ tư.

Xu hướng toàn cầu hóa đã thu hẹp biên giới giữa giới học thuật hàn lâm cùng với doanh nghiệp, xóa mờ rào càn giữa công nghệ xã hội với công nghệ thông tin, nắm rõ hơn tinh quái giới giữa xã hội thực cùng xã hội ảo... Các điều khiếu nại này đang sản xuất ra thời cơ cho công ty xã hội học bước chân vào những lĩnh vực liên ngành khi cai quản các chương trình phân tích cao cấp như R. Tiếp cận R nhanh chóng là phương thức để học tứ duy như 1 nhà công nghệ dữ liệu, là phương pháp đón đầu xu cố kỉnh và cách đầu cai quản cuộc chơi trong một thế giới được phủ đầy bởi tài liệu và thông tin.

---

TÀI LIỆU THAM KHẢO

<1> Đặng Hùng Thắng & Trần bạo dạn Cường (2019), “Thống kê đến khoa học xã hội và công nghệ sự sống (với phần mềm R)”, NXB Đại học tổ quốc Hà Nội

<2> Hadley Wickham & Garett Grolemund (2017), “R for data science”, NXB Oreilly

<3> Nguyễn Văn Tuấn (2018), “Phân tích tài liệu với R”, NXB Tổng phù hợp Hồ Chí Minh

<6> Nguyễn Chí Dũng, “Kinh tế lượng ứng dụng với R”, bạn dạng thảo Ebook---

NGUỒN ẢNH

Hình 1: https://4.bp.blogspot.com/-u
G56_Ia
Y0MQ/V3ZKty
UJEb
I/AAAAAAAAC3Y/p
Xt
UDi
MBW94ZOX-d_prc2c
SBk
QEHAod
QQCLc
B/s1600/upload.jpg

Hình 2: https://www.digitalvidya.com/wp-content/uploads/2017/03/Data-Analytics-using-R-1024x605.jpg

HÌnh 3: https://www.geeksforgeeks.org/basic-syntax-in-r-programming/

Hình 4: https://encrypted-tbn0.gstatic.com/images?q=tbn%3AANd9Gc
Qvo19o
UMXb
AFg
Lht7x_Wj
YHTrop
PD02QZq
KQ&usqp=CAU

HÌnh 5: https://dax.co.id/storage/img/services/service_webanalytic.jpg

Hình 6: https://media.boingboing.net/wp-content/uploads/2019/04/product_21178_product_shots1_image.jpg

Hình 7: https://lh3.googleusercontent.com/proxy/2Jtty
It3FAwd
Ca6u
NTHV3s
C7QBo7C3r
Ew
Jz
Fca
HQNl
Yq8y6r
NZXh91Qdl1oma
Og
YWb8Fm
Iv_k66azw
R_Ke
GDm
NZkx
Xps6Z2-d0G6QYVpk
Ob
Bf_kq
GJKYVKIbkr7q4Kk
Wv2K1n
Z2i
Bnly
O6u2Ctf
Fnw