Açıq
Yaxın

Habra statistikinə kömək etmək üçün R dili. R paketi nədir: təlimat kitabçası R nədir

Bunu terminalda yazmalısınız.

R-nin gözəlliyi budur:

  1. Bu proqram pulsuzdur (GPL lisenziyası altında paylanır),
  2. Geniş çeşidli problemləri həll etmək üçün bu proqram üçün çoxlu paketlər yazılmışdır. Onların hamısı da pulsuzdur.
  3. Proqram çox çevikdir: istənilən vektor və matrislərin ölçüləri istifadəçinin istəyi ilə dəyişdirilə bilər, verilənlərin sərt strukturu yoxdur. Bu xüsusiyyət, tədqiqatçının ixtiyari bir dövr üçün proqnoz verməsi lazım olduqda, proqnozlaşdırma vəziyyətində son dərəcə faydalıdır.

Sonuncu xüsusiyyət xüsusilə aktualdır, çünki digər statistik paketlər (məsələn, SPSS, Eviews, Stata) bizi yalnız sabit struktura malik olan məlumatları təhlil etməkdə maraqlı ola biləcəyimizi güman edir (məsələn, işləyən fayldakı bütün məlumatlar eyni dövrilikdə olmalıdır). eyni başlanğıc və bitmə tarixləri ilə).

Bununla belə, R ən dost proqram deyil. Onunla işləyərkən, siçanı unutun - demək olar ki, bütün vacib hərəkətlər əmr satırından istifadə etməklə həyata keçirilir. Ancaq həyatı bir az asanlaşdırmaq və proqramın özünü bir az daha qonaqpərvər etmək üçün RStudio adlı bir ön proqram var. Onu buradan yükləyə bilərsiniz. R-nin özü artıq quraşdırıldıqdan sonra quraşdırılır, RStudio bir çox rahat alətlərə və gözəl interfeysə malikdir, lakin orada təhlil və proqnozlaşdırma hələ də əmr satırından istifadə etməklə həyata keçirilir.

Gəlin bu gözəl proqrama nəzər salmağa çalışaq.

RStudio ilə tanışlıq

RStudio interfeysi belə görünür:

RStudio-da yuxarı sağ küncdə layihənin adı göstərilir (hələlik bizdə “Yoxdur” - yəni yoxdur). Bu yazıya klikləsək və “Yeni Layihə” seçsək, bizdən layihə yaratmağımız təklif olunacaq. Əsas proqnozlaşdırma məqsədləri üçün "Yeni Kataloq" (layihə üçün yeni qovluq), "Boş Layihə" (boş layihə) seçin və sonra layihənin adını daxil edin və onu saxlamaq üçün qovluğu seçin. Təsəvvürünüzü işə salın və özünüz bir ad tapmağa çalışın :).

Bir layihə ilə işləyərkən siz həmişə orada saxlanılan məlumatlara, əmrlərə və skriptlərə daxil ola bilərsiniz.

RStudio pəncərəsinin sol tərəfində konsol var. Burada müxtəlif əmrləri daxil edəcəyik. Məsələn, aşağıdakıları yazaq:

x< - rnorm (100 , 0 , 1 )

Bu əmr sıfır gözlənti və vahid dispersiya ilə normal paylanmadan 100 təsadüfi dəyişən yaradacaq, sonra "x" adlı bir vektor yaradacaq və nəticədə 100 dəyəri ona yazacaq. Simvol "<-» эквивалентен символу «=» и показывает какое значение присвоить нашей переменной, стоящей слева. Иногда вместо него удобней использовать символ «->”, baxmayaraq ki, bu vəziyyətdə dəyişənimiz sağda olmalıdır. Məsələn, aşağıdakı kod "x" obyekti ilə tamamilə eyni olan "y" obyekti yaradacaq:

x -> y

Bu vektorlar indi ekranın yuxarı sağ hissəsində, “Ətraf mühit” başlıqlı tabın altında görünür:

"Ətraf mühit" tabındakı dəyişikliklər

Ekranın bu hissəsi sessiya zamanı saxladığımız bütün obyektləri göstərəcək. Məsələn, belə bir matris yaratsaq:

\(A = \begin(pmatrix) 1 & 1 \\ 0 & 1 \end(pmatrix) \)

bu əmrlə:

A< - matrix (c (1 , 0 , 1 , 1 ) , 2 , 2 )

sonra "Ətraf mühit" sekmesinde görünəcək:

İstifadə etdiyimiz hər hansı bir funksiya bizdən müəyyən parametrlərə bəzi dəyərlər təyin etməyi tələb edir. Funksiyada matrix() aşağıdakı parametrlər var:

  • data – matrisə yazılmalı olan verilənləri olan vektor,
  • nrow - matrisdəki sıraların sayı,
  • ncol - matrisdəki sütunların sayı,
  • byrow - məntiqi parametr. Əgər “DOĞRU” (doğrudur), onda matris sətirlərlə doldurulacaq (soldan sağa, sətir-sətir). Varsayılan olaraq, bu parametr FALSE olaraq təyin edilmişdir.
  • dimnames - sətir və sütun adları olan vərəq.

Bu parametrlərdən bəzilərinin standart dəyərləri var (məsələn, sıra = FALSE), digərləri isə buraxıla bilər (məsələn, dimnames).

"R" nin hiylələrindən biri hər hansı bir funksiyaya (məsələn, bizim matrix()) dəyərləri birbaşa təyin etməklə həll edilə bilər:

Başqa bir seçim, "Ətraf mühit" sekmesinde obyekt adının üzərinə klikləməkdir.

Matris

burada matris bizi maraqlandıran funksiyanın adıdır. Bu halda, RStudio xüsusilə sizin üçün təsviri ilə "Yardım" panelini açacaq:

Siz həmçinin funksiyanın adını “Axtarış” pəncərəsində (linzalı ikona) “Kömək” sekmesinde yazmaqla funksiya ilə bağlı yardım tapa bilərsiniz.

Bir funksiyanın adını necə yazacağınızı və ya hansı parametrlərdən istifadə olunduğunu dəqiq xatırlamırsınızsa, konsolda onun adını yazmağa başlayın və "Tab" düyməsini basın:

Bütün bunlara əlavə olaraq RStudio-da skriptlər yaza bilərsiniz. Proqram yazmaq və ya bir sıra funksiyaları çağırmaq lazımdırsa, bunlar sizə lazım ola bilər. Skriptlər yuxarı sol küncdə artı işarəsi olan düymədən istifadə etməklə yaradılır (açılan menyuda “R Script” seçməlisiniz). Bundan sonra açılan pəncərədə istənilən funksiyaları və şərhləri yaza bilərsiniz. Məsələn, x seriyası üzərində xətt qrafiki çəkmək istəsək, bunu belə edə bilərik:

süjet(x)

xətlər(x)

Birinci funksiya sadə səpələnmə qrafiki qurur, ikinci funksiya isə nöqtələri ardıcıl olaraq birləşdirən nöqtələrin üstünə xətlər əlavə edir. Bu iki əmri seçib “Ctrl+Enter” düymələrini sıxsanız, onlar yerinə yetiriləcək və RStudio-nun sağ alt küncdəki “Plot” sekmesini açmasına və orada çəkilmiş süjeti göstərməsinə səbəb olacaq.

Gələcəkdə hələ də bütün yazılmış əmrlərə ehtiyacımız varsa, bu skript saxlanıla bilər (yuxarı sol küncdə disket).

Keçmişdə artıq yazdığınız əmrə müraciət etmək lazımdırsa, ekranın yuxarı sağ hissəsində “Tarix” nişanı var. Orada sizi maraqlandıran hər hansı bir əmri tapıb seçə və onu konsola yapışdırmaq üçün iki dəfə klikləyə bilərsiniz. Konsolun özündə siz klaviaturanızdakı Yuxarı və Aşağı düymələrindən istifadə edərək əvvəlki əmrlərə daxil ola bilərsiniz. “Ctrl+Up” düymələr kombinasiyası konsolda bütün son əmrlərin siyahısını göstərməyə imkan verir.

Ümumiyyətlə, RStudio-da proqramla işi xeyli asanlaşdıran çoxlu faydalı klaviatura qısa yolları var. Onlar haqqında daha çox oxuya bilərsiniz.

Daha əvvəl qeyd etdiyim kimi, R üçün bir çox paket var. Onların hamısı CRAN serverində yerləşir və onlardan hər hansı birini quraşdırmaq üçün onun adını bilmək lazımdır. Paketlərin quraşdırılması və yenilənməsi "Paketlər" sekmesinden istifadə etməklə həyata keçirilir. Ona getmək və "Quraşdır" düyməsini klikləməklə, aşağıdakı menyu kimi bir şey görəcəyik:

Açılan pəncərədə yazaq: proqnoz Rob J. Hyndman tərəfindən yazılmış və bizim üçün çoxlu faydalı funksiyaları ehtiva edən paketdir. “Quraşdır” düyməsini klikləyin, bundan sonra “proqnoz” paketi quraşdırılacaq.

Alternativ olaraq, konsoldakı əmrdən istifadə edərək adını bilən istənilən paketi quraşdıra bilərik:

yüklemek. paketlər ("hamar")

bir şərtlə ki, o, əlbəttə ki, CRAN anbarında olsun. hamar funksiyaları inkişaf etdirdiyim və saxladığım paketdir.

Bəzi paketlər yalnız github.com kimi saytlarda mənbə kodunda mövcuddur və əvvəlcə onların qurulmasını tələb edir. Windows altında paketlər yaratmaq üçün sizə Rtools proqramı lazım ola bilər.

Quraşdırılmış paketlərdən hər hansı birini istifadə etmək üçün onu aktivləşdirməlisiniz. Bunu etmək üçün onu siyahıda tapıb işarələməli və ya konsolda əmrdən istifadə etməlisiniz:

kitabxana (proqnoz)

Windows-da bir xoşagəlməz problem görünə bilər: bəzi paketlər asanlıqla yüklənir və yığılır, lakin heç bir şəkildə quraşdırılmır. Bu halda R belə bir şey yazır: “Xəbərdarlıq: müvəqqəti quraşdırmanı köçürmək mümkün deyil...”. Bu halda sizə lazım olan tək şey R ilə qovluğu antivirusunuzdakı istisnalara əlavə etməkdir (və ya paketləri quraşdırarkən onu söndürün).

Paketi endirdikdən sonra ona daxil olan bütün funksiyalar bizim üçün əlçatan olacaq. Məsələn, funksiya tsdisplay(), bu kimi istifadə edilə bilər:

tsdisplay(x)

O, bizə "Forecaster Toolbar" fəslində müzakirə edəcəyimiz üç qrafik quracaq.

Paketdən başqa proqnoz Mən paketi müxtəlif nümunələr üçün tez-tez istifadə edirəm Mkomp. O, M-Competition verilənlər bazasından verilənlər seriyasını ehtiva edir. Buna görə də onu quraşdırmağı məsləhət görürəm.

Çox vaxt bizə yalnız məlumat dəstləri deyil, "ts" sinifinin (vaxt seriyası) məlumatlarına ehtiyacımız olacaq. İstənilən dəyişəndən zaman seriyası yaratmaq üçün aşağıdakı əmri yerinə yetirməlisiniz:

x< - ts (x , start = c (1984 , 1 ) , frequency = 12 )

Budur parametr başlamaq zaman seriyamızın başladığı tarixi təyin etməyə imkan verir və tezlik məlumat tezliyini təyin edin. Nümunəmizdəki 12 rəqəmi aylıq məlumatlarla məşğul olduğumuzu göstərir. Bu əmrin yerinə yetirilməsi nəticəsində biz “x” vektorumuzu 1984-cü ilin yanvarından başlayaraq aylıq məlumatların zaman seriyasına çeviririk.

Gəlin bir az R adlı proqramlaşdırma dili haqqında danışaq. Bu yaxınlarda siz bizim bloqlarımızda statistika və qrafiklərlə işləmək üçün sadəcə güclü bir dilə ehtiyacınız olan sahələr haqqında məqalələr oxuya bilərsiniz. Və R onlardan yalnız biridir. Proqramlaşdırma dünyasına yeni gələn üçün buna inanmaq olduqca çətin olacaq, lakin bu gün R artıq SQL-dən daha populyardır, kommersiya təşkilatlarında, tədqiqatlarda və universitetlərdə fəal şəkildə istifadə olunur.

Qaydalara, sintaksislərə və xüsusi istifadələrə girmədən, gəlin R-i sıfırdan öyrənməyə kömək edəcək əsas kitablara və resurslara nəzər salaq.

R dili nədir, sizə nə üçün lazımdır və ondan necə ağıllı istifadə edə bilərsiniz, GeekWeek-2015 çərçivəsində bir ildən bir qədər az əvvəl apardığı gözəl Ruslan Kuptsovdan öyrənə bilərsiniz.

Kitablar

İndi başınızda müəyyən bir nizam var, ədəbiyyatı oxumağa başlaya bilərsiniz, xoşbəxtlikdən bu kifayət qədər çoxdur. Yerli müəlliflərdən başlayaq:


İnternet resursları

İstənilən proqramlaşdırma dilini öyrənmək istəyən hər kəs bilik axtarışında iki resursa müraciət etməlidir: onun tərtibatçılarının rəsmi veb-saytı və ən böyük onlayn icma. Yaxşı. R üçün istisna etməyək:

Ancaq yenə də ingilis dilini öyrənməyə hələ vaxtı olmayan, lakin həqiqətən R dilini öyrənmək istəyənlər üçün narahatlıq hissi keçirərək, bir neçə rus resursunu qeyd edək:

Bu arada, gəlin şəkli ingilisdilli, lakin heç də az olmayan təhsil saytlarının kiçik bir siyahısı ilə tamamlayaq:

CRAN əslində R inkişaf mühitini kompüterinizə endirə biləcəyiniz yerdir. Bundan əlavə, təlimatlar, nümunələr və digər faydalı oxunuşlar;

Quick-R - statistika, onların işlənməsi üsulları və R dili haqqında qısa və aydın;

Burns-Stat - çox sayda nümunə ilə R və onun sələfi S haqqında;

R for Data Science Garrett Grolemunddan onlayn dərslik formatına tərcümə edilmiş başqa bir kitabdır;

Awesome R - sevimli GitHub-da yerləşdirilən rəsmi veb saytından ən yaxşı kodun seçimi;

Mran - Microsoft-dan R dili;

Tutorial R rəsmi internet saytından mütəşəkkil məlumatlar olan başqa bir mənbədir.

Aşağıdakı mövzu məni bu yazını yazmağa vadar etdi: İdeal yazı axtarışında və ya Habr tapmacası. Fakt budur ki, R dili ilə tanış olduqdan sonra Excel-də nəyisə hesablamaq cəhdlərinə son dərəcə cəsarətli baxıram. Amma etiraf edim ki, R ilə cəmi bir həftə əvvəl tanış olmuşam.

Məqsəd: R dilindən istifadə edərək sevimli HabraHabr-dan məlumat toplamaq və əslində R dilinin nə üçün yaradıldığını həyata keçirmək, yəni: statistik analiz.

Beləliklə, bu mövzunu oxuduqdan sonra öyrənəcəksiniz:

  • Veb resurslarından məlumat çıxarmaq üçün R-dən necə istifadə edə bilərsiniz?
  • Sonrakı təhlil üçün məlumatları necə çevirmək olar
  • R ilə daha yaxından tanış olmaq istəyənlər üçün hansı mənbələri oxumaq tövsiyə olunur?

Oxucunun dilin əsas konstruksiyaları ilə tanış olmaq üçün kifayət qədər müstəqil olması gözlənilir. Məqalənin sonundakı bağlantılar bunun üçün ən uyğundur.

Hazırlıq

Aşağıdakı resurslara ehtiyacımız olacaq:

Quraşdırıldıqdan sonra belə bir şey görməlisiniz:

Aşağı sağ paneldə, Paketlər sekmesinde, quraşdırılmış paketlərin siyahısını tapa bilərsiniz. Əlavə olaraq aşağıdakıları quraşdırmalıyıq:

  • Rcurl - şəbəkə ilə işləmək üçün. CURL ilə işləyən hər kəs dərhal açılan bütün imkanları anlayacaq.
  • XML - XML ​​sənədinin DOM ağacı ilə işləmək üçün paket. Xpath vasitəsilə elementləri tapmaq üçün bizə funksionallıq lazımdır
"Paketləri quraşdırın" düyməsini basın, sizə lazım olanları seçin və sonra onları cari mühitə yükləmək üçün işarə ilə seçin.

Məlumat əldə edilir

İnternetdən alınan sənədin DOM obyektini əldə etmək üçün bu sətirləri izləmək kifayətdir:
url<-"http://habrahabr.ru/feed/posts/habred/page10/" cookie<-"Мои сверхсекретные печеньки" html<-getURL(url, cookie=cookie) doc<-htmlParse(html)
Zəhmət olmasa göndərilən kukilərə diqqət yetirin. Təcrübəni təkrarlamaq istəyirsinizsə, sayta daxil olduqdan sonra brauzerinizin aldığı kukiləri əvəz etməli olacaqsınız. Sonra, bizi maraqlandıran məlumatları əldə etməliyik, yəni:
  • Yazı dərc olunanda
  • Neçə baxış var idi?
  • Neçə insan bu girişi sevimlilərinə əlavə etdi?
  • +1 və -1 üzərində neçə klik var idi (cəmi)
  • Neçə +1 klik var idi?
  • Nə qədər -1
  • Cari reytinq
  • Şərhlərin sayı
Çox təfərrüata varmadan sizə sadəcə kodu verəcəyəm:
nəşr edilmişdir<-xpathSApply(doc, "//div[@class="published"]", xmlValue) pageviews<-xpathSApply(doc, "//div[@class="pageviews"]", xmlValue) favs<-xpathSApply(doc, "//div[@class="favs_count"]", xmlValue) scoredetailes<-xpathSApply(doc, "//span[@class="score"]", xmlGetAttr, "title") scores<-xpathSApply(doc, "//span[@class="score"]", xmlValue) comments<-xpathSApply(doc, "//span[@class="all"]", xmlValue) hrefs<-xpathSApply(doc, "//a[@class="post_title"]", xmlGetAttr, "href")
Burada elementlər və atributlar üçün xpath axtarışından istifadə etdik.
Bundan sonra, alınan məlumatlardan data.frame yaratmaq çox tövsiyə olunur - bu verilənlər bazası cədvəllərinin analoqudur. Müxtəlif mürəkkəblik səviyyələrində sorğular etmək mümkün olacaq. Bəzən R-də bu və ya digər şeyi necə zərif şəkildə edə bildiyinizə heyrətlənirsiniz.
yazılar<-data.frame(hrefs, published, scoredetailes, scores, pageviews, favs, comments)
Data.frame-ni yaratdıqdan sonra, alınan məlumatları düzəltməli olacaqsınız: sətirləri rəqəmlərə çevirmək, real tarixi normal formatda almaq və s. Bunu belə edirik:

Posts$şərhlər<-as.numeric(as.character(posts$comments)) posts$scores<-as.numeric(as.character(posts$scores)) posts$favs<-as.numeric(as.character(posts$favs)) posts$pageviews<-as.numeric(as.character(posts$pageviews)) posts$published<-sub(" декабря в ","/12/2012 ",as.character(posts$published)) posts$published<-sub(" ноября в ","/11/2012 ",posts$published) posts$published<-sub(" октября в ","/10/2012 ",posts$published) posts$published<-sub(" сентября в ","/09/2012 ",posts$published) posts$published<-sub("^ ","",posts$published) posts$publishedDate<-as.Date(posts$published, format="%d/%m/%Y %H:%M")

Artıq alınanlardan hesablanmış əlavə sahələri əlavə etmək də faydalıdır:
xallar bölündü<-sapply(strsplit(as.character(posts$scoredetailes), "\\D+", perl=TRUE),unlist) if(class(scoressplitted)=="matrix" && dim(scoressplitted)==4) { scoressplitted<-t(scoressplitted) posts$actions<-as.numeric(as.character(scoressplitted[,1])) posts$plusactions<-as.numeric(as.character(scoressplitted[,2])) posts$minusactions<-as.numeric(as.character(scoressplitted[,3])) } posts$weekDay<-format(posts$publishedDate, "%A")
Burada "Ümumi 35: 29 və ↓6" formasının məşhur mesajlarını neçə hərəkətin yerinə yetirildiyi, nə qədər müsbət və nə qədər mənfi cəhətlər olduğu barədə məlumatlar toplusuna çevirdik.

Bu nöqtədə deyə bilərik ki, bütün məlumatlar qəbul edilib və analiz üçün hazır formata çevrilib. Yuxarıdakı kodu istifadəyə hazır funksiya kimi formatladım. Məqalənin sonunda mənbəyə keçid tapa bilərsiniz.

Ancaq diqqətli oxucu artıq qeyd etdi ki, bu şəkildə bütün seriya üçün məlumat əldə etmək üçün yalnız bir səhifə üçün məlumat aldıq. Səhifələrin bütün siyahısı üçün məlumat əldə etmək üçün aşağıdakı funksiya yazılmışdır:

GetPostsForPages<-function(pages, cookie, sleep=0) { urls<-paste("http://habrahabr.ru/feed/posts/habred/page", pages, "/", sep="") ret<-data.frame() for(url in urls) { ret<-rbind(ret, getPosts(url, cookie)) Sys.sleep(sleep) } return(ret) }
Burada təsadüfən habrın özündə habra effekti yaratmamaq üçün Sys.sleep sistem funksiyasından istifadə edirik :)
Bu funksiyanın aşağıdakı kimi istifadə edilməsi təklif olunur:
yazılar<-getPostsForPages(10:100, cookie,5)
Beləliklə, 10-dan 100-ə qədər bütün səhifələri 5 saniyəlik fasilə ilə yükləyirik. 10-a qədər olan səhifələr bizi maraqlandırmır, çünki orada reytinqlər hələ görünmür. Bir neçə dəqiqə gözlədikdən sonra bütün məlumatlarımız yazılar dəyişənindədir. Hər dəfə mərkəzi narahat etməmək üçün onları dərhal saxlamağı məsləhət görürəm! Bu bu şəkildə edilir:
write.csv(yazılar, fayl="posts.csv")
Və onu belə oxuyuruq:
yazılar<-read.csv("posts.csv")

Yaşasın! Biz Habr-dan statistik məlumatları necə qəbul etməyi və növbəti analiz üçün yerli olaraq saxlamağı öyrəndik!

Məlumatların təhlili

Bu bölməni demədən tərk edəcəm. Mən oxucunu məlumatların özü ilə oynamağa və öz uzunmüddətli nəticələrini almağa dəvət edirəm. Məsələn, həftənin günündən asılı olaraq müsbət və mənfi insanların əhval-ruhiyyəsinin asılılığını təhlil etməyə çalışın. Çıxardığım yalnız 2 maraqlı nəticəni verəcəm.
Habr istifadəçiləri aşağı səs verməkdən daha çox səs verməyə hazırdırlar.
Bunu aşağıdakı qrafikdən görmək olar. Minusların "buludunun" müsbətlərin yayılmasından nə qədər vahid və daha geniş olduğuna diqqət yetirin. Müsbət cəhətlərlə baxış sayı arasındakı əlaqə mənfi cəhətlərdən daha güclüdür. Başqa sözlə: düşünmədən əlavə edirik, amma hərəkət üçün minus edirik!
(Qrafiklərdəki yazılara görə üzr istəyirəm: onları rus dilində necə düzgün göstərəcəyimi hələ başa düşməmişəm)

Həqiqətən də yazıların bir neçə sinfi var
Bu ifadə sözügedən yazıda verilən kimi istifadə olundu, amma reallıqda buna əmin olmaq istədim. Bunu etmək üçün, mənfi cəhətlər üçün eyni olan hərəkətlərin ümumi sayına müsbətlərin orta payını hesablamaq və ikincini birinciyə bölmək kifayətdir. Hər şey homojen olsaydı, histoqramda çoxlu yerli zirvələri müşahidə etməməliyik, amma onlar var.


Gördüyünüz kimi, 0.1, 0.2 və 0.25 ətrafında tələffüz zirvələri var. Oxucunu bu sinifləri özü tapıb “adlandırmağa” dəvət edirəm.
Qeyd etmək istərdim ki, R verilənlərin klasterləşdirilməsi, yaxınlaşması, fərziyyələrin yoxlanılması və s. alqoritmlərlə zəngindir.

Faydalı Resurslar

Həqiqətən R dünyasına dalmaq istəyirsinizsə, aşağıdakı linkləri tövsiyə edirəm. Zəhmət olmasa R mövzusunda maraqlı bloqlarınızı və saytlarınızı şərhlərdə paylaşın, rus dilində R haqqında yazan varmı?

R. Səviyyə 1-də proqramlaşdırma. Əsaslar

R dili dünyanın ən məşhur statistik məlumatların təhlili vasitəsidir. O, məlumatların təhlili, vizuallaşdırılması, sənədlər və veb proqramların yaradılması üçün geniş imkanları ehtiva edir. Təcrübəli mentorun rəhbərliyi ilə bu güclü dili mənimsəmək istəyirsiniz? Sizi kursa dəvət edirik "R dilində proqramlaşdırma. Səviyyə 1. Əsas biliklər".

Bu kurs böyük həcmli məlumatlarda nümunələri axtarmaq, onları vizuallaşdırmaq və statistik cəhətdən düzgün nəticələr çıxarmaq ehtiyacı olan geniş spektrli mütəxəssislər üçün nəzərdə tutulub: sosioloqlar, klinik sınaq menecerləri/farmakoloqlar, tədqiqatçılar (astronomiya, fizika, biologiya, genetika, tibb, s.), İT analitikləri, biznes analitikləri, maliyyə analitikləri, marketoloqlar. Kurs, həmçinin funksionallıqdan (və ya ödənişlərdən) rahat olmayan mütəxəssislərə müraciət edəcəkdir / .

Dərslər zamanı siz məlumatların təhlili və ətraf mühitdə vizuallaşdırma üzrə əsas bacarıqlar əldə edəcəksiniz R. Çox vaxt praktiki tapşırıqlara və real məlumat dəstləri ilə işləməyə həsr olunur. Siz verilənlərlə işləmək üçün bütün yeni alətləri öyrənəcək və onları işinizdə necə tətbiq edəcəyinizi öyrənəcəksiniz.

Kursdan sonra mərkəzin təkmilləşdirmə sertifikatı verilir.

R paketi nədir?

R paketi, . R-də işləməyi təsəvvür etmək çətin olan paketlər baza yığımına daxildir və R-ni kompüterinizdə quraşdırdıqdan sonra avtomatik olaraq əlçatan olur (R nüvəsi adlanır). Məsələn, stat paketi sizə statistik testlər keçirməyə imkan verir və qrafik paketi sayəsində siz R-də qrafiklər qura bilərsiniz. Bununla belə, əksər paketlərdə yüksək ixtisaslaşdırılmış proqramlar var və onlarla işləmək üçün siz R kitabxananızı “uzatmaq” lazımdır. lazımi paketi kompüterinizə quraşdırmaq.

Texniki nöqteyi-nəzərdən R paketi standart sxemə uyğun olaraq vahid bütövlükdə toplanmış məlumat və sənədlər toplusudur. Hər bir paket səhvlər və Rəsmi R Paket Arxivinin (CRAN) standartlarına uyğun olaraq sınaqdan keçirilməlidir. Hər hansı uyğunsuzluq aşkar edilərsə, paket CRAN-a qəbul edilməyəcək. Bu yanaşma sayəsində istənilən R paketi ilə işləmə prinsipləri eynidir ki, bu da onları sadə və asan istifadə edir. 2018-ci ilin payızına qədər CRAN-da paketlərin sayı keçdi !!!

R-də paketi necə quraşdırmaq və yükləmək olar?

R paketini quraşdırmağın bir neçə yolu var. Ən çox yayılmış vəziyyətdən başlayaq: CRAN-dan paket quraşdırmaq. Bunun üçün konsola install.packages funksiyasını daxil edin və arqumentlərdə axtardığınız paketin adını yazın (məsələn, ggplot2 paketini götürün):

install.packages("ggplot2")

Ölkələrin siyahısı ilə açılan pəncərədə yükləmək üçün istənilən güzgü seçin. Paketin kitabxananıza quraşdırılması prosesi avtomatik başlayacaq. Bəzən kitabxananıza bir paket əvəzinə bir neçəsinin yükləndiyini görə bilərsiniz. Bu, paketin tez-tez digər paketlərin funksiyalarından və ya məlumatlarından istifadə etməsi ilə baş verir, onlar olmadan quraşdırılmış R paketi tam işləyə bilməyəcək. Beləliklə, asılılıqları olan paket ( asılılıqlar) digər paketləri “yuxarı çəkir” və onlarla birlikdə kitabxanaya quraşdırılır.

Paketi quraşdırdıqdan sonra kitabxana() funksiyasından istifadə edərək onu cari sessiyanıza yükləməlisiniz:

kitabxana("ggplot2")

Bu edilmədikdə, quraşdırılmış paketin funksiyaları işləməyəcəkdir. Bu onunla izah olunur ki, R işə düşəndə ​​yalnız əsas paketlər (bu barədə yuxarıda yazmışdıq) ona avtomatik yüklənir, qalanları isə əl ilə yüklənməlidir.

GitHub vasitəsilə R paketinin quraşdırılması

Bununla belə, bütün R paketləri CRAN-da mövcud deyil. Bir çox tədqiqatçı kollektiv şəkildə GitHub platformasında R paketləri üzərində işləyir, burada fikirlərini bölüşür, səhvlər haqqında məlumat verir, onları düzəldir və digər istifadəçiləri onlayn xəbərdar edir. Çox vaxt paketlər GitHub-da dərc olunur, onlar hələ inkişaf/sınaq mərhələsindədirlər, buna görə də onların sabitliyinə zəmanət verilmir. GitHub-dan R paketini yükləmək üçün əvvəlcə “devtools” paketini quraşdırmalı, onu R mühitinə yükləməli və install_github() funksiyasından istifadə etməlisiniz, burada biz arqumentlərdə paketin əsas tərtibatçısının adını və , kəsiklə ayrılmış, paketin adı:

install.packages("devtools") kitabxanası("devtools") install_github("Müəllif/PaketAdı")

R paketini əl ilə quraşdırın (tar.gz və ya zip arxivi)

Bəzi paketlər digər platformalarda (məsələn, ResearchGate), tədqiqat qruplarının saytlarında və ya tərtibatçının şəxsi saytında yerləşir, oradan R paketini arxiv kimi kompüterinizə .tar.gz və ya . zip uzantısı. Bu halda siz eyni install.packages() əmrindən istifadə edərək paketi əl ilə endirməlisiniz. Bununla belə, funksiyanın birinci arqumentində paketin adını deyil, yüklənmiş arxivin ünvanını göstərməli, həmçinin əlavə arqumentlər daxil etməlisiniz:

install.packages("Desktop/PackageName.tar.gz", repos = NULL, type="mənbə")

Sənədləri oxumaq R paketləri ilə işləməyin açarıdır!

Sənədləşdirmə istifadəçinin R paketi ilə qarşılıqlı əlaqəsinin ən vacib elementidir. Bu, vebsayt postu, maarifləndirici video, elmi nəşr və ya istinad bələdçisi şəklində ola bilər. İlk üç variant paketin ideyasını və imkanlarını aydın şəkildə nümayiş etdirməyə imkan verir. Məhz onlarla sizə naməlum bir paketlə tanış olmağa başlamağı tövsiyə edirəm (əgər onlar İnternetdə mövcuddursa).

İstinad Bələdçisi ( İstinad kitabçası), əksinədir texniki R paketinin təsviri, onun funksiyaları və verilənləri. Digər sənəd növlərindən fərqli olaraq, CRAN-da mövcud olan hər hansı paketin istinad kitabçası var. O, xüsusi formatda yazılır və funksiya kodu ilə sinxronlaşdırılır. Nəticə olaraq, R mühitində yardım əmrlərindən istifadə edərək yardım məlumatı axtara bilərsiniz. Məsələn, quraşdırılmış paketin təsvirini öyrənmək üçün ggplot2 , sadəcə olaraq paketin adını və ardınca sual işarəsini daxil edin:

?ggplot2

İndi ggplot2 paketi haqqında bütün mövcud məlumatlarımız var. Eyni şəkildə, müəyyən bir funksiyanın sənədlərinə baxa bilərsiniz: paketin adından sonra qoşa nöqtə və axtardığınız funksiyanın adını qoyun (məsələn, stat_ellipse funksiyası ) :

Eyni şeyi rəsmi CRAN saytında PDF formatında tapmaq olar (məsələn, ggplot2 paketinin istinad kitabçası). Birinci səhifədə R paketinin təsviri, sonra onun funksiyalarının siyahısı və verilənlər cədvəli, sonra onların hər birinin əlifba sırası ilə ətraflı texniki təsviri var.

Nəticə

Sənədləri oxuduqdan sonra R paketini öz məqsədləriniz üçün etibarlı şəkildə istifadə edə bilərsiniz. Mən burada universal göstərişlər verə bilmərəm, çünki... Hamımızın fərqli vəzifələri var və buna uyğun olaraq fərqli paketlərdən istifadə edirik. Buna görə də, hər hansı bir çətinlik və ya sualınız varsa, şərhlərdə yazın, cavab verməkdən məmnun olaram.

Və növbəti məqalədə R paketini öz əllərimizlə yığacağıq!