R (Programmiersprache)

R ist eine äußerst vielseitige Programmiersprache und Umgebung für statistische Berechnungen und Datenvisualisierungen. Mit einer Fülle von Funktionen und Bibliotheken bietet R eine leistungsstarke Plattform für die Datenanalyse und -verarbeitung. Von der Textverarbeitung bis zur statistischen Modellierung bietet R eine breite Palette von Funktionen, die es ermöglichen, komplexe Datenanalysen durchzuführen und aussagekräftige Erkenntnisse zu gewinnen.

Auf JBerries bieten wir eine umfassende Einführung in die Programmierung und Datenanalyse mit R:

Die Entwicklung eines Zufallsgenerators für gleichverteilte Mikrozustände in R verdeutlicht die Anwendung von R in der Simulation und statistischen Modellierung. Dieser Artikel erklärt die grundlegenden Konzepte hinter dem Zufallsgenerator und bietet Einblicke in die Implementierung in R sowie die Übertragbarkeit auf andere Programmiersprachen.

Die verschiedenen Schleifenkonstrukte in R, darunter while, repeat und for-Schleifen, bieten Flexibilität bei der Implementierung wiederholter Aufgaben. Die Syntax und Anwendungsfälle dieser Schleifen werden ausführlich erläutert, wodurch Leser ein fundiertes Verständnis für deren Einsatz in der Praxis erhalten.

Die Bedingungsprüfung und Alternativen in R, einschließlich der if-else-Struktur und der ifelse() Funktion, sind fundamentale Konzepte in der Programmierung. Diese Kontrollstrukturen ermöglichen es, den Programmfluss basierend auf bestimmten Bedingungen zu steuern, was für die Implementierung komplexer Algorithmen unerlässlich ist.

Dataframes und Faktoren sind zwei wichtige Datenstrukturen in R, die häufig in der Datenanalyse verwendet werden. Diese Artikel bieten einen umfassenden Einblick in die Erstellung, Verarbeitung und Anwendung von Dataframes und Faktoren, was Lesern ermöglicht, Daten effektiv zu organisieren und zu analysieren.

Textverarbeitung mit R: Die Funktion format() zum Formatieren von Objekten für Ausgaben

Die Funktion format() dient dazu Ausgaben zu formatieren. Meist wird sie verwendet, um Gleitkommazahlen mit einer geeigneten Anzahl von gültigen Stellen darzustellen. Diese und weitere Einsatzmöglichkeiten (wissenschaftliche Darstellung von Zahlen) sowie Eigenschaften der Implementierung von format() (wie etwa weitere Eingabewerte, der Rückgabewert von format()) werden an zahlreichen Beispielen erläutert.

13 Feb. 2023

R (Programmiersprache) Textverarbeitung format() Zeichnenkette Vektor Formatierung Dataframe Faktor Fließkommazahl Gleitkommazahlen gültige Stellen

Textverarbeitung mit R: Die Funktion cat() zum Erzeugen von Ausgaben

Die Funktion cat() bietet die einfachste Möglichkeit, Informationen über ein Objekt oder mehrere Objekte auf der Konsole auszugeben. Die Besonderheiten der Funktion werden vorgestellt, wie etwa spezielle Formatierungsanweisungen oder die Möglichkeit die Ausgabe in eine Datei umzuleiten.

26 Dez. 2022

Textverarbeitung concatenation cat() Datei Trennungszeichen backslash Anführungsstrich Zeichnenkette Vektor Tabulator Zeilenumbruch Formatierung print() str() paste0() paste() R (Programmiersprache)

Entwicklung eines Zufallsgenerators für gleichverteilte Mikrozustände (Implementierung in R)

Nach dem Postulat der statistischen Mechanik besitzen alle Mikrozustände, die ein System annehmen kann, die gleiche Wahrscheinlichkeit. Für zahlreiche Simulationen benötigt man einen Zufallsgenerator, der diese gleichverteilten Mikrozustände erzeugt. Dieser Zufallsgenerator wird in der Programmiersprache R entwickelt, die Erklärungen sind aber so allgemein gehalten, dass man sie leicht in eine andere Programmiersprache übersetzen kann.

01 Mär. 2021

Makrozustand statistische Mechanik Gleichverteilung Mikrozustand R (Programmiersprache) Zufallsgenerator Stars and Bars Partition Ziehung ohne Zurücklegen

Die while-Schleife und die repeat-Schleife in R

Die while-Schleife und die repeat-Schleife sind etwas allgemeiner als die for-Schleife. Wenn man weiß, wie oft eine Schleife durchlaufen werden soll, ist die for-Schleife weniger fehleranfällig einzusetzen. Ist dagegen nur die Bedingung bekannt, unter die Schleife verlassen werden soll, muss man die while- oder repeat-Schleife einsetzen. Die while-Schleife realisiert die kopfgesteuerte Schleife, die repeat-Schleife besitzt keine Bedingungsprüfung. Wie bei der for-Schleife können die Schlüsselwörter break (vorzeitiges Verlassen der Schleife) und next (sofortiger Übergang zum nächsten Schleifen-Durchlauf) eingesetzt werden.

01 Jul. 2019

Iteration next break while fußgesteuerte Schleife Schleife for-Schleife repeat R (Programmiersprache) Schleifenkörper kopfgesteuerte Schleife

Die for-Schleife in R

Schleifen mit einer Zählvariable werden eingesetzt, wenn bekannt ist, wie oft ein gewisser Vorgang wiederholt werden muss (wobei die Anweisungen nicht exakt identisch sind, sondern meist vom Wert der Zählvariable abhängen). Die Syntax der for-Schleife sowie einige mit ihr verbundene Spitzfindigkeiten werden erklärt. Zusätzliche Kontrolle über den Ablauf einer Schleife erhält man durch break (vorzeitiges Verlassen der Schleife) und next (sofortiger Übergang zum nächsten Wert der Zählvariable).

27 Jun. 2019

Iteration next break Schleife for-Schleife R (Programmiersprache) Schleifenkörper Zählvariable

Die Mehrfachalternative in R: die Funktion switch()

Die Mehrfachalternative lässt sich durch verschachtelte Alternativen realisieren, was aber oft zu umständlichen und fehleranfälligen Quelltexten führt. Übersichtlicher ist die Realisierung mit der Funktion switch(). Für sie gibt es in R zwei Versionen, die sich in der Bedingungsprüfung unterscheiden: entweder wird eine Zeichenkette ausgewertet (character-Version) oder das Ergebnis der Bedingungsprüfung wird in eine ganze Zahl verwandelt (integer-Version).

19 Jun. 2019

integer-Version character-Version Bedingungsprüfung R (Programmiersprache) switch Mehrfachalternative

Bedingung und Alternative in R: if else und ifelse

Die Bedingungsprüfung mit if und die Alternative mit if else sind die wohl am häufigsten eingesetzten Kontrollstrukturen, durch die sich der Ablauf eines Programmes steuern lässt – sie sorgen dafür, dass gewisse Programm-Teile nur ausgeführt werden, wenn eine bestimmte Bedingung erfüllt ist. In R gibt es zusätzlich eine vektorisierte Variante der Alternative mit ifelse().

13 Jun. 2019

identical() Kontrollstrukturen R (Programmiersprache) if logischer Vektor ifelse() Bedingung Alternative if else Logische Operationen

Dataframes in R: Anwendungen

Nach den grundlegenden Eigenschaften im Kapitel "Dataframes in R: der Datentyp data frame" werden jetzt Anwendungen von Dataframes gezeigt: der Zugriff auf ein Dataframe (auf Spalten, Zeilen, einzelne Elemente oder Teilmengen), Sortierung eines Dataframes, Daten-Aggregation, Umwandlung in eine Matrix sowie das Schreiben eines Dataframes in eine Datei und umgekehrt das Lesen von tabellarischen Daten aus einer Datei.

11 Jun. 2019

data frame Sortierung Daten-Aggregation read.table() Liste R (Programmiersprache) Dataframe write.table() Matrix aggregate()

Dataframes in R: der Datentyp data frame

Der Datentyp Dataframe vereinigt viele Eigenschaften der Datentypen Matrix und Liste und ist in zahlreichen Anwendungen der geeignete Rahmen, um statistische Daten zu speichern und ihre Auswertung vorzubereiten. Der erste Teil über Dataframes zeigt, wie man sie erzeugen und ihre Eigenschaften abfragen kann (Diagnose-Funktionen). Im nächsten Kapitel werden Anwendungen von Dataframes gezeigt.

03 Jun. 2019

data frame Liste R (Programmiersprache) Diagnose-Funktionen Dataframe Matrix rekursive Struktur

Faktoren in R: Anwendungen

In der Statistik muss man oft Daten gruppieren und die gruppierten Daten auswerten. In R wird eine derartige Gruppierung mit einem Faktor (oder mehreren Faktoren) vorgenommen. Das Kapitel beschreibt R-Funktionen, die diese Aufgaben erleichtern, und zeigt ihre praktische Anwendung.

28 Mai. 2019

cut() Faktor geordneter Faktor tapply() factor R (Programmiersprache) table() Vergröberung split()

Faktoren in R: der Datentyp factor

In der Statistik steht man oft vor der Aufgabe, eine Reihe von Messdaten zu klassifizieren (oder: gruppieren) und die gruppierten Daten weiter auszuwerten (etwa Häufigkeiten der Klassen feststellen, Mittelwertbildung innerhalb der Klassen). Man kann diese Operationen natürlich auf der Ebene von Vektoren durchführen, indem man geeignete Funktionen für Vektoren anwendet. In R gibt es den Datentyp factor, der die Klassifizierung vornimmt und zahlreiche Auswertungen deutlich vereinfacht. Vorgestellt werden hier zuerst die Begriffe aus der Statistik, die mit der Klassifizierung von Daten zusammenhängen; weiter wie Faktoren und geordnete Faktoren erzeugt werden sowie deren Eigenschaften. Im folgenden Kapitel werden dann Anwendungen mit Faktoren gezeigt.

26 Mär. 2019

Faktor geordneter Faktor ordered Klassifizierung factor R (Programmiersprache) Diagnose-Funktionen Merkmalstyp Level Merkmal

Listen in R: Anwendungen

Funktionen aus den Basis-Paketen von R werden besprochen, mit denen Listen verarbeitet werden können. Insbesondere wird dabei auf die rekursive Struktur von Listen eingegangen.

21 Jan. 2019

Liste R (Programmiersprache) c() unlist() lengths() rekursive Struktur

Listen in R: der Datentyp list

Listen sind in R die grundlegende rekursive Struktur: anders als bei einem Vektor, bei dem alle Komponenten einen identischen Datentyp besitzen müssen, ist für die Komponenten einer Liste ein beliebiger Datentyp zulässig - sie können sogar selber wieder Listen sein. Vorgestellt werden Funktionen zum Erzeugen von Listen, der Zugriff auf die Komponenten einer Liste, Diagnose-Funktionen für Listen und das Attribut names.

18 Jan. 2019

Attribut names Modus Liste R (Programmiersprache) Diagnose-Funktionen atomare Struktur rekursive Struktur

Felder in R: der Datentyp array

Felder sind in R die Verallgemeinerung von Matrizen. In einer Matrix werden die Komponenten zweidimensional angeordnet (Zeilen und Spalten), in einem Feld sind beliebige Dimensionen zugelassen. Erzeugt werden Felder meist, indem ein Vektor mit Hilfe des Dimensionsvektors mehrdimensional angeordnet wird, oder mit der Funktion outer(). Weitere Gemeinsamkeiten und Unterschiede zu Matrizen werden diskutiert.

13 Dez. 2018

Dimensionsvektor aperm() outer() array R (Programmiersprache) Feld Matrix Kreuzprodukt

Matrizen in R: Anwendungen

Vorgestellt wird, wie Matrizen miteinander verknüpft werden, welche Funktionen Eigenschaften von Matrizen anzeigen, sowie zahlreiche Funktionen aus der Linearen Algebra (Berechnung von Determinanten, Lösung von linearen Gleichungssystemen, Berechnung von transponierten und inversen Matrizen, Berechnung von Eigenwerten und Eigenvektoren).

10 Dez. 2018

Skalarprodukt crossprod() Determinante Eigenwert which() Indexvektor Dimensionsvektor transponierte Matrix lineares Gleichungssystem inverse Matrix R (Programmiersprache) Matrizenmultiplikation Matrix Eigenvektor

Matrizen in R: der Datentyp matrix

Die Komponenten eines Vektors können in R zweidimensional angeordnet werden wie in einer Matrix. Es werden verschiedene Möglichkeiten gezeigt, wie man Matrizen erzeugen kann, wie man spezielle Matrizen erzeugt und wie man auf die Komponenten einer Matrix zugreift. Weiter werden der Dimensionsvektor (Attribut dim) und das optionale Attribut dimnames vorgestellt. Wie Matrizen verknüpft werden und weitere Anwendungen folgen im nächsten Kapitel (Matrizen in R: Anwendungen).

08 Dez. 2018

Einheitsmatrix recycling Dimensionsvektor Diagonalmatrix dimnames dim diag() R (Programmiersprache) äußeres Produkt Matrix Indexvektor

Vektoren in R: Anwendungen

Grundlegend für das Verständnis von Operationen, die mit Vektoren ausgeführt werden können, sind die punktweise Ausführung (eine Operation wird an die Komponenten weitergereicht) und der recycling-Mechanismus, der festlegt, wie Vektoren mit unterschiedlichen Längen verknüpft werden. Ausgehend hiervon werden zahlreiche Operationen vorgestellt, die mit Vektoren ausgeführt werden können (wie zum Beispiel statistische Funktionen, Sortier-Algorithmen, Mengen-Operationen).

05 Dez. 2018

Skalarprodukt recycling Sortieralgorithmen Mengen-Operationen sort() dot-dot-dot na.rm which() Indexvektor any() R (Programmiersprache) all() Vektor

Vektoren in R: der Datentyp vector

Da es in R eigentlich keine fundamentalen Datentypen gibt (wie ganze Zahlen, Gleitkommazahlen, Zeichen, logische Werte), sondern diese Spezialfall eines Vektors der Länge 1 sind, ist dieses Kapitel entscheidend für das Verständnis von R. Vektoren bestehen aus Komponenten mit identischem Speichermodus und die Komponenten sind numeriert (oder wie man auch sagt: indiziert). Vorgestellt werden hier Funktionen zum Erzeugen von Vektoren, der Zugriff auf die Komponenten eines Vektors, Diagnose-Funktionen für Vektoren und das Attribut names. Wie man Vektoren verknüpft und welche weiteren Funktionen zur Weiterverarbeitung von Vektoren existieren, wird im nächsten Kapitel gezeigt (Vektoren in R: Anwendungen).

04 Dez. 2018

Index Attribut names R (Programmiersprache) c() Diagnose-Funktionen Vektor rep() seq()

Zahlenbereiche und spezielle Werte in R (Inf, NaN, NA und NULL)

Gezeigt wird, wie man in R die Zahlenbereiche für die Modi integer und double feststellen kann und wie man Zahlen in Potenz-Schreibweise eingeben kann. Ausführlich werden die Ausnahme-Werte Inf (Infinity), NaN (Not a Number), NA (Not Available) und NULL vorgestellt.

29 Nov. 2018

NaN NA Zahlenbereiche NULL Not Available R (Programmiersprache) Not a Number Potenz Inf

Einführung in R: Zeichen

In R sind Zeichen kein fundamentaler Datentyp; sie werden nicht von Zeichenketten unterschieden. Um aber mit den Besonderheiten der Verarbeitung von Zeichen vertraut zu werden, werden vorerst nur Zeichen behandelt. Diese Besonderheiten betreffen insbesondere die Maskierung von bestimmten Zeichen und die Typumwandlungen. Einige harmlose Beispiele für Zeichenketten (die ohne Wissen über Vektoren verständlich sind) werden hier schon angeführt.

28 Nov. 2018

Maskierung Zeichenkette R (Programmiersprache) Zeichen Typumwandlung

Einführung in R: Logische Werte

Boolesche Variablen können die beiden Werte TRUE und FALSE annehmen. Sie entstehen zum Beispiel bei Vergleichsoperationen und können durch zahlreiche logische Operationen miteinander verknüpft werden. Insbesondere um Fallunterscheidungen zu formulieren und den Ablauf eines Programmes zu steuern, werden sie eingesetzt.

25 Okt. 2018

Boolesche Variable R (Programmiersprache) Vergleichsoperatoren Logische Operationen

Eigenschaften von R und Vorbereitungen

Um R-Programme schreiben und ausführen zu können, sind einige Vorbereitungen nötig: Installation von R, Installation einer Entwicklungsumgebung, Anlegen und Strukturierung eines Arbeitsverzeichnisses. Diese Vorbereitungen und kleine erste Programme werden für den Programmier-Einsteiger erläutert. Weiter werden viele Hinweise gegeben, wie man sich das Arbeiten mit R erleichtern kann.

24 Okt. 2018

R-Skript RStudio R (Programmiersprache) HelloWorld (R) Helferlein Installation RGui

Übersicht über Datentypen in R

Die Programmiersprache R besitzt ihr eigenes Konzept, wie die eingebauten Datentypen aufgebaut sind; es unterscheidet sich von vielen anderen Programmiersprachen darin, dass es nicht elementaren Datentypen gibt (wie Zahlen, Zeichen und logische Werte) und zusammengesetzte Datentypen (also zum Beispiel Vektoren von Zahlen). Sondern es gibt nur Vektoren; eine Zahl ist dann ein Spezialfall eines Vektors der Länge 1. Neben den Vektoren gibt es sehr viele weitere vorbereitete Datentypen, so dass man als Programmierer erst für sehr spezielle Anwendungen eigene Datentypen definieren muss. Es wird eine Übersicht über die Datentypen in R gegeben sowie die Vorgehensweise beschrieben, wie man mit ihnen vertraut werden kann.

24 Okt. 2018

Attribut Modus R (Programmiersprache) Speicher-Modus Diagnose-Funktionen atomare Struktur Typumwandlung rekursive Struktur

Einführung in R: Zahlen und Variablen

In R gibt es eigentlich keine elementaren Datentypen (wie Zahlen, logische Werte oder Zeichen), sondern nur Vektoren. Um die Rechenoperationen (Grundrechenarten, insbesondere Division mit Rest, wissenschaftliche Funktionen) für Zahlen besser kennenzulernen, werden hier Zahlen wie elementare Datentypen behandelt. Zur Unterscheidung von ganzen Zahlen und Gleitkommazahlen benötigt man die Konzepte Modus und Speicher-Modus. Es werden erste Beispiele gezeigt, wie man in R mit Variablen umgeht.

24 Okt. 2018

Arithmetische Operationen Gleitkommazahlen Ganzzahl-Division Modus R (Programmiersprache) Speicher-Modus Variable Diagnose-Funktionen Typumwandlung ganze Zahlen

Einführung in die Informatik

Einführung in die Informatik für Ingenieure und Naturwissenschaftler. Kurs zum Selbststudium, der das Grundwissen in Informatik etwa im Umfang einer einsemestrigen Vorlesung zusammenstellt.

15 Nov. 2017

Programmierung Rechnerarchitektur Naturwissenschaftler R (Programmiersprache) Informatik C++ Ingenieure