Data Applied Cloud Mining mit neuen Funktionen

Data Applied Logo in Data Applied bietet Cloud Mining mit neuen Funktionen

Data Applied.com Logo (c) Data Applied

Data Applied.com, eine der ersten und führenden Cloud Mining Firmen weltweit, hat ihrem Angebot neue Funktionalitäten hinzugefügt. Die neue Datentransformation in der Data Mining Webapplikation vervollständigt nun die Möglichkeiten, die neben dem Data Mining auch die Visualisierung und das Reporting der Daten umfassen. Das wird die Ergebnisse für Marketing Aufgaben nochmals verbessern.

Mittels einem Schritt-für-Schritt Wizard können nun alle nötigen Transformationen ausgeführt werden, es können auch neue Datenreihen oder Sets erstellt werden. Die Metadaten-Transformation umfasst das erstellen, umbenennen, konvertieren und löschen von Feldern. Die Zeilen-Transformation bietet filtern, Stichproben ziehen, Ranking und zufälliges neu sortieren der Zeilen.

Neue Felder können aus alten Feldern abgeleitet werden, mithilfe von eingebauten mathematischen, statistischen oder Text-basierten Funktionen. Auch ein Geo-Mapping Tool wurde integriert, in dem man eine Geo-basierte Karte für die Darstellung von Daten benutzen kann. Mit einem neuen View-Sharing Tool können Ergebnisse geschützt auf einzelnen Website verbreitet werden. Weitere Informationen auf www.data-applied.com.

Cloud Computing Tage 2010

Dk Logo Rechts in Cloud Computing Tage 2010

Veranstaltet vom Deutschen Kongress

Business as a Service und IT as a Service – Wege zu mehr Wirtschaftlichkeit – unter diesem Motte finden dieses Jahr die Cloud Computing Tage 2010 in Hamburg, Frankfurt am Main und Stuttgart statt. Unter anderem wird dort Prof. Dr. Jakob Rehof, Fraunhofer Institut für Software und Systemtechnik ISST seine Meinung zum Cloud Computing darstellen, ist es nur ein Hype oder bereits Realität? Mit Sicherheit eine spannende und lohnende Veranstaltung, gerade zum Thema Cloud Mining.

Cloud Computing Gütesiegel von EuroCloud

Eurocloud Eco in Cloud Computing Gütesiegel von Eurocloud

Logo des EuroCloud Deutschland eco e.V.

Eurocloud, die Europaïsche Föderation der Cloud Computing und SaaS Industrie, hat in Deutschland ein neues Mitglied im Verband dazugewonnen: EuroCloud Deutschland_eco e.V..  Dieser Verein setzt sich für Akzeptanz und bedarfsgerechte Bereitstellung von Cloud Services am deutschen Markt ein. Er repräsentiert die deutschen Cloud Computing-Wirtschaft im paneuropäischen Netzwerk EuroCloud.

Ziel des Vereins ist das Schaffen eines SaaS-Gütesiegels, um Kunden des Cloud Computing größtmögliche Sicherheit bei der Entscheidung für den SaaS Vertriebsweg zu bieten. Gerade beim Cloud Mining, bei dem sich viele Unternehmensdaten in der Cloud befinden, ist so ein Siegel ausdrücklich zu befürworten.

Der Ruf nach Sicherheit in der Cloud war in der Vergangenheit immer lauter geworden, da ist das Schaffen einer solchen Güte-Instanz ein wichtiger Schritt.

RapidMiner von Rapid-I auf der CeBIT 2010

RapidMiner ist ein tausendfach verbreitetes Open-Source Data Mining Tool der Firma Rapid-I GmbH aus Dortmund. Auf der CeBIT hatte ich Gelegenheit mich bei dem Co-Founder Ralf Klinkenberg über RapidMiner zu informieren und ein paar interessante Details zu erfahren, z.B. ob sich mit dem RapidMiner Cloud Mining realisieren läßt. Hier ein kurzer Überblick über den RapidMiner und die Firma Rapid-I dahinter.

Rapidminer 190 in RapidMiner von Rapid-I auf der CeBIT 2010

RapidMiner auf der CeBIT 2010

RapidMiner, vielen Data Minern noch unter dem Namen YALE bekannt, wurde ab 2001 an der Universtät Dortmund entwickelt. Seit dem hat es seine Leistungsfähigkeit oft unter Beweis stellen können – ich selbst habe es damals das erste Mal beim Data Mining Cup 2006 ausprobiert. Mittlerweile wird es bei der Open-Source Plattform sourceforge gehostet und dort auch weiterentwickelt. Zur Zeit ist bereits die 5. Version der Software im Einsatz.

Weiterlesen: RapidMiner von Rapid-I auf der CeBIT 2010

Cloud Mining bald auch bei SAS?

Sas Logo in CeBIT 2010: Cloud Mining bald auch bei SAS?

SAS Institute Inc.

Auf der CeBIT 2010 habe ich natürlich auch den SAS Institute Stand aufgesucht. Es war mal wieder ein sehr interessanter Austausch, und ich habe sogar endlich eine eigene SAS Tasse bekommen! Auf meine Frage hin, ob denn das SAS Institute irgend etwas in Richtung Cloud Mining vor hat, wurde ich von meinem Gesprächspartner höflich an die Presse-Abteilung weitergeleitet. Aber dann hat der Mitarbeiter doch noch schnell eine Bemerkung gemacht, die ihm plötzlich einfiel, und die mich aufhorchen ließ; „…ja, SAS hat tatsächlich eine Privat Cloud in der Pipeline„. Es wird zu diesem Zweck ein großes Rechenzentrum für Data Mining aufgebaut, ergab meine Nachfrage. Ich vermute SAS wird den SAS Enterprise Miner aufbohren, um ihn für Cloud Mining zu befähigen. Wann das passieren und wo das Rechenzentrum sein wird, wollte oder konnte der Mitarbeiter aber nicht sagen, dafür warte ich mal das Feedback der Presse-Abteilung ab… Aber hochinteressant, das auch der größte Mitspieler im Data Mining Markt diesen Trend zur Cloud nicht verschläft.

Sas Cebit 2010 in CeBIT 2010: Cloud Mining bald auch bei SAS?

SAS Institute auf der CeBIT 2010: Cloud Mining in der Pipeline?

Cloud Mining: Data Mining in der Cloud

Notebook Cloud Mining-300x254 in Cloud Mining - CRM Data Mining in der Cloud

Cloud Mining für CRM

Cloud Mining ist eine neue Herangehensweise große Datenmengen mit Data Mining zu bearbeiten. In diesem Artikel wird Cloud Mining kurz vorgestellt.

Data Mining hat sich zu einer festen Analysetechnik in Marketing (CRM) und Vertrieb von Unternehmen entwickelt. Es sorgt durch Anwendung von statistisch-mathematischen Methoden auf große Datenmengen z.B. für eine optimierte Kundenansprache für Werbemaßnahmen, hilft beim Bewerten von Kaufpotentialen der Stammkunden oder bemisst die Kündigungswahrscheinlichkeit von Kunden. Dadurch können Unternehmen ihre Marketingmaßnahmen präzisieren und bei weniger Marketingausgaben mehr Umsatz erzielen.

Weiterlesen: Cloud Mining – CRM Data Mining in der Cloud

Genetische Algorithmen mit SQL

Bot Square-300x183 in Genetische Algorithmen mit SQL

Fleissiger Data Mining Bot!

Data Mining nur mit SQL als Sprache wird häufig nicht in Betracht gezogen und doch eignet es sich zur Lösung mancher Probleme, wie folgender Artikel A Genetic Algorithm Sample in T-SQL von William Talada zeigt.
Er löst das folgende Problem auf eindrucksvolle Weise.

Auf einem 10×10 Feld umgeben von einer Mauer liegen in der Hälfte der Felder leere Dosen. Ein Roboter startet in diesem Feld und kann 200 Aktionen ausführen, um all diese Dosen einzusammeln und das Feld zu reinigen. Er kann in alle Himmelsrichtungen gehen oder eine Dose aufheben. Seine Sichtweite ist auf fünf Felder beschränkt, das auf dem er steht und die vier angrenzenden Felder.

Weiterlesen: Genetische Algorithmen mit SQL

Data Mining im KDD Environment

1996 hat Osama Fayyad einen sehr populären Prozess vorgestellt, wie Firmen aus ihren Daten sinnvolle Informationen generieren können. Dieser KDD Standard hat sich seitdem als eine Art Basis der Datenaufbereitung etabliert – auch in der Praxis. Dieser Artikel gibt Auskunft warum Data Mining ein Vorverarbeitung und eine Nachbearbeitung benötigt und warum es alleine nicht funktioniert.

Der Ansatz, Wissen aus Daten zu ziehen, wurde von Fayyad in individuelle Schritte unterteilt. Für jeden Schritt werden verschiedene Tools benötigt, und unterschiedliche Zustände der Daten kommen dabei heraus.

Fayyad1996-300x141 in Data Mining im KDD Environment

KDD Prozess von Fayyad 1996

KDD steht für „Knowledge Discovery in Databases„. Laut Fayyad gibt es folgende Schritte: Selection, Pre-processing, Transformation, Data Mining und Interpretation. Diese fünf Schritte werden iterativ durchlaufen. Jeder Schritt kann also Arbeitsschritt gesehen werden, wo der Einfluß des Benutzer zu unterschiedlichen Ergebnissen führen kann. Das beste Ergebnis wird dann für den nächsten Schritt gewählt, die anderen werden dokumentiert.

Weiterlesen: Data Mining im KDD Environment

Massive Möglichkeiten für Real-World Simulationen

MASSIVE Battle in Massive Möglichkeiten

Screenshot einer Anwendung der MASSIVE Software

MASSIVE (steht für Multiple Agent Simulation System in Virtual Environment) sollte vielen Kino-Gängern und Herr der Ringe Fans zumindest hinsichtlich seiner Leistung bekannt sein – mit dieser Software der Neuseeländischen Special Effects Schmiede WETA wurden die mächtigen Schlachten animiert, in der tausende Krieger aufeinander eindroschen. Eines der absoluten Highlights der Herr der Ringe Verfilmungen. Und ein mächtiger erster Fingerabdruck den WETA mit MASSIVE hinterlassen hat. Aber ist es interessant für Data Mining Interessierte?

Das spannende an der Software ist, das sie jeden Agenten mit hilfe von Fuzzy Logic individuell agieren läßt – er also spezielle Handlungen selbst entscheidet. Beispielsweise das er sich entscheidet alle Waffen fallenzulassen und schreiend davon rennt – wenn um ihn herum viele andere Krieger das auch tun.
Weiterlesen: Massive Möglichkeiten

Überrepräsentation

Nadel in Überrepräsentation - Oversampling

Die Nadel im Heuhafen - leider typisch für Data Mining

Um das Data Mining Ergebnis bei seltener Zielvariable zu verbessern, empfiehlt es sich die Zielvariable  stärker zu gewichten.  Hier wird gezeigt wie das geht – wann man es macht und wie man die Überrepräsentation wieder zurück rechnet.

Um ein besseres Ergebnis zu erhalten wenn die Zielvariable nur selten oder sehr selten vorkommt (das ist der Fall bei einem Anteil von <10%), empfiehlt es sich generell die Zielvariable im Datenbestand über-zu-repräsentieren. Dies sollte in der Regel immer das Modell verbessern. Man spricht bei SAS von „Oversampling“ – es gibt aber andere Bedeutungen für diesen Begriff. Während bei SAS davon gesprochen wird, wenn man das Auftreten einer Zielvariable „relativ“ zum Gesamten erhöht in dem man die Nicht-Zielvariable entfernt, kann es auch bedeuten die Zielvariable durch kopieren zu vermehren (Redundanz). Wir bleiben hier bei der SAS-Sichtweise für Data Mining.

Weiterlesen: Überrepräsentation – Oversampling