<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
		>
<channel>
	<title>Kommentare für Data Mining - Blog.de</title>
	<atom:link href="http://www.datamining-blog.de/comments/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.datamining-blog.de</link>
	<description>CRM Marketing mit Data Mining und Cloud Mining verbessern</description>
	<lastBuildDate>Fri, 16 Sep 2011 14:33:22 +0000</lastBuildDate>
	<generator>http://wordpress.org/?v=2.9.1</generator>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
		<item>
		<title>Kommentar zu Cloud Computing Tage 2010 von Guilhermina</title>
		<link>http://www.datamining-blog.de/konferenzen/cloud-computing-tage-2010/comment-page-1/#comment-67</link>
		<dc:creator>Guilhermina</dc:creator>
		<pubDate>Fri, 16 Sep 2011 14:33:22 +0000</pubDate>
		<guid isPermaLink="false">http://www.datamining-blog.de/?p=283#comment-67</guid>
		<description>Dear Sir:


I am developing a prediction model with a logistic regression by using SAS Enterprise Miner. The original sample (N=342) only has 16 target “1” category, which corresponds to 4,7% (16/342) of the observations. To handle the imbalanced sample and the rare events issue, at the sample general property panel, for the level based option I set sample proportion as 50.0. Hence I end up with a sample containing 32 observations (16 observations for target “1” category and 16 observations for the target “0” category), which I used to developed the prediction model.


However my PhD Adviser is concern because “the occurrence probability from the scoring is not the one that predicts correctly for the original distribution, it is the one that predicts correctly for the oversampled set”. For my PhD thesis stand point of view, I must provide references that this methodology “oversampling” approach is legible.

 

I really appreciate if you could  help me to address the issue of imbalanced sample and its rare events. If possible, could you suggest me any references in order to prove that this approach is legible and accepted by the Statisticians community?



Thank you so much for your kind cooperation.</description>
		<content:encoded><![CDATA[<p>Dear Sir:</p>
<p>I am developing a prediction model with a logistic regression by using SAS Enterprise Miner. The original sample (N=342) only has 16 target “1” category, which corresponds to 4,7% (16/342) of the observations. To handle the imbalanced sample and the rare events issue, at the sample general property panel, for the level based option I set sample proportion as 50.0. Hence I end up with a sample containing 32 observations (16 observations for target “1” category and 16 observations for the target “0” category), which I used to developed the prediction model.</p>
<p>However my PhD Adviser is concern because “the occurrence probability from the scoring is not the one that predicts correctly for the original distribution, it is the one that predicts correctly for the oversampled set”. For my PhD thesis stand point of view, I must provide references that this methodology “oversampling” approach is legible.</p>
<p>I really appreciate if you could  help me to address the issue of imbalanced sample and its rare events. If possible, could you suggest me any references in order to prove that this approach is legible and accepted by the Statisticians community?</p>
<p>Thank you so much for your kind cooperation.</p>
]]></content:encoded>
	</item>
	<item>
		<title>Kommentar zu Cloud Mining bei Layered Technologies? von Aliyah Paul</title>
		<link>http://www.datamining-blog.de/data-mining/cloud-mining-bei-layered-technologies/comment-page-1/#comment-65</link>
		<dc:creator>Aliyah Paul</dc:creator>
		<pubDate>Wed, 27 Jul 2011 10:35:01 +0000</pubDate>
		<guid isPermaLink="false">http://www.datamining-blog.de/?p=21#comment-65</guid>
		<description>Nice story, Your blog page was shared by Christian Dillstrom,  the mobile &amp; social media marketing veteran, so you must be doing a beautiful job.</description>
		<content:encoded><![CDATA[<p>Nice story, Your blog page was shared by Christian Dillstrom,  the mobile &amp; social media marketing veteran, so you must be doing a beautiful job.</p>
]]></content:encoded>
	</item>
	<item>
		<title>Kommentar zu Cloud Mining &#8211; CRM Data Mining in der Cloud von andres villanueva</title>
		<link>http://www.datamining-blog.de/data-mining/cloud-mining-crm-marketing/comment-page-1/#comment-64</link>
		<dc:creator>andres villanueva</dc:creator>
		<pubDate>Mon, 16 May 2011 08:19:47 +0000</pubDate>
		<guid isPermaLink="false">http://www.datamining-blog.de/?p=200#comment-64</guid>
		<description>,</description>
		<content:encoded><![CDATA[<p>,</p>
]]></content:encoded>
	</item>
	<item>
		<title>Kommentar zu Data Mining im KDD Environment von Data Mining ohne Experte zu sein - Data Mining - Blog.de</title>
		<link>http://www.datamining-blog.de/data-mining/data-mining-im-kdd-environment/comment-page-1/#comment-54</link>
		<dc:creator>Data Mining ohne Experte zu sein - Data Mining - Blog.de</dc:creator>
		<pubDate>Tue, 07 Sep 2010 21:09:59 +0000</pubDate>
		<guid isPermaLink="false">http://www.datamining-blog.de/?p=162#comment-54</guid>
		<description>[...] Benutzer wird automatisch durch die Datenaufbereitung und all die anderen notwendigen Data Mining Aufgaben [...]</description>
		<content:encoded><![CDATA[<p>[...] Benutzer wird automatisch durch die Datenaufbereitung und all die anderen notwendigen Data Mining Aufgaben [...]</p>
]]></content:encoded>
	</item>
	<item>
		<title>Kommentar zu Cloud Mining &#8211; CRM Data Mining in der Cloud von Cloud Computing Tage 2010 - Data Mining - Blog.de</title>
		<link>http://www.datamining-blog.de/data-mining/cloud-mining-crm-marketing/comment-page-1/#comment-41</link>
		<dc:creator>Cloud Computing Tage 2010 - Data Mining - Blog.de</dc:creator>
		<pubDate>Wed, 24 Mar 2010 11:32:23 +0000</pubDate>
		<guid isPermaLink="false">http://www.datamining-blog.de/?p=200#comment-41</guid>
		<description>[...] Business as a Service und IT as a Service &#8211; Wege zu mehr Wirtschaftlichkeit &#8211; unter diesem Motte finden dieses Jahr die Cloud Computing Tage 2010 in Hamburg, Frankfurt am Main und Stuttgart statt. Unter anderem wird dort Prof. Dr. Jakob Rehof, Fraunhofer Institut für Software und Systemtechnik ISST seine Meinung zum Cloud Computing darstellen, ist es nur ein Hype oder bereits Realität? Mit Sicherheit eine spannende und lohnende Veranstaltung, gerade zum Thema Cloud Mining. [...]</description>
		<content:encoded><![CDATA[<p>[...] Business as a Service und IT as a Service &#8211; Wege zu mehr Wirtschaftlichkeit &#8211; unter diesem Motte finden dieses Jahr die Cloud Computing Tage 2010 in Hamburg, Frankfurt am Main und Stuttgart statt. Unter anderem wird dort Prof. Dr. Jakob Rehof, Fraunhofer Institut für Software und Systemtechnik ISST seine Meinung zum Cloud Computing darstellen, ist es nur ein Hype oder bereits Realität? Mit Sicherheit eine spannende und lohnende Veranstaltung, gerade zum Thema Cloud Mining. [...]</p>
]]></content:encoded>
	</item>
	<item>
		<title>Kommentar zu Data Mining im KDD Environment von Data Applied, führende Cloud Mining Firma für Marketing, bietet neue Features für Datentransformation - Data Mining - Blog.de</title>
		<link>http://www.datamining-blog.de/data-mining/data-mining-im-kdd-environment/comment-page-1/#comment-40</link>
		<dc:creator>Data Applied, führende Cloud Mining Firma für Marketing, bietet neue Features für Datentransformation - Data Mining - Blog.de</dc:creator>
		<pubDate>Wed, 24 Mar 2010 11:30:06 +0000</pubDate>
		<guid isPermaLink="false">http://www.datamining-blog.de/?p=162#comment-40</guid>
		<description>[...] neue Funktionalitäten hinzugefügt. Die neue Datentransformation in der Data Mining Webapplikation vervollständigt nun die Möglichkeiten, die neben dem Data Mining auch die Visualisierung und das Reporting der [...]</description>
		<content:encoded><![CDATA[<p>[...] neue Funktionalitäten hinzugefügt. Die neue Datentransformation in der Data Mining Webapplikation vervollständigt nun die Möglichkeiten, die neben dem Data Mining auch die Visualisierung und das Reporting der [...]</p>
]]></content:encoded>
	</item>
	<item>
		<title>Kommentar zu Cloud Mining &#8211; CRM Data Mining in der Cloud von Data Applied, führende Cloud Mining Firma für Marketing, bietet neue Features für Datentransformation - Data Mining - Blog.de</title>
		<link>http://www.datamining-blog.de/data-mining/cloud-mining-crm-marketing/comment-page-1/#comment-39</link>
		<dc:creator>Data Applied, führende Cloud Mining Firma für Marketing, bietet neue Features für Datentransformation - Data Mining - Blog.de</dc:creator>
		<pubDate>Wed, 24 Mar 2010 11:29:03 +0000</pubDate>
		<guid isPermaLink="false">http://www.datamining-blog.de/?p=200#comment-39</guid>
		<description>[...] Applied.com, eine der ersten und führenden Cloud Mining Firmen weltweit, hat ihrem Angebot neue Funktionalitäten hinzugefügt. Die neue [...]</description>
		<content:encoded><![CDATA[<p>[...] Applied.com, eine der ersten und führenden Cloud Mining Firmen weltweit, hat ihrem Angebot neue Funktionalitäten hinzugefügt. Die neue [...]</p>
]]></content:encoded>
	</item>
	<item>
		<title>Kommentar zu Data Mining im KDD Environment von RapidMiner von Rapid-i auf der CeBIT 2010 - Data Mining - Blog.de</title>
		<link>http://www.datamining-blog.de/data-mining/data-mining-im-kdd-environment/comment-page-1/#comment-33</link>
		<dc:creator>RapidMiner von Rapid-i auf der CeBIT 2010 - Data Mining - Blog.de</dc:creator>
		<pubDate>Wed, 17 Mar 2010 14:23:18 +0000</pubDate>
		<guid isPermaLink="false">http://www.datamining-blog.de/?p=162#comment-33</guid>
		<description>[...] Data Mining im KDD Environment  [...]</description>
		<content:encoded><![CDATA[<p>[...] Data Mining im KDD Environment  [...]</p>
]]></content:encoded>
	</item>
</channel>
</rss>

