<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
		>
<channel>
	<title>Comments on: Faire son propre moteur de recherche avec Nutch</title>
	<atom:link href="http://www.csquad.org/2010/01/11/nutch/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.csquad.org/2010/01/11/nutch/</link>
	<description>Just for fun</description>
	<lastBuildDate>Mon, 06 Sep 2010 10:52:30 +0000</lastBuildDate>
	<generator>http://wordpress.org/?v=2.9.1</generator>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
		<item>
		<title>By: Alain Barbason</title>
		<link>http://www.csquad.org/2010/01/11/nutch/comment-page-1/#comment-1717</link>
		<dc:creator>Alain Barbason</dc:creator>
		<pubDate>Tue, 31 Aug 2010 18:15:56 +0000</pubDate>
		<guid isPermaLink="false">http://www.csquad.org/?p=973#comment-1717</guid>
		<description>Le lien sur nutch est cassé, j&#039;ai utilisé http://www.apache.org/dyn/closer.cgi/nutch/

L&#039;intérêt pour moi n&#039;est pas de concurrencer google (quoique), mais de faire un moteur de recherche ciblé sur quelques dizaines de sites. A suivre, je suis à la phase d&#039;installation.</description>
		<content:encoded><![CDATA[<p>Le lien sur nutch est cassé, j&#8217;ai utilisé <a href="http://www.apache.org/dyn/closer.cgi/nutch/" rel="nofollow">http://www.apache.org/dyn/closer.cgi/nutch/</a></p>
<p>L&#8217;intérêt pour moi n&#8217;est pas de concurrencer google (quoique), mais de faire un moteur de recherche ciblé sur quelques dizaines de sites. A suivre, je suis à la phase d&#8217;installation.</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: cscm</title>
		<link>http://www.csquad.org/2010/01/11/nutch/comment-page-1/#comment-1561</link>
		<dc:creator>cscm</dc:creator>
		<pubDate>Wed, 20 Jan 2010 14:06:39 +0000</pubDate>
		<guid isPermaLink="false">http://www.csquad.org/?p=973#comment-1561</guid>
		<description>@mattboll : la réponse officieuse à l&#039;orale ;-) 
Ma réponse officiel, le p2p n&#039;est pas une solution fiable dans une dictature numèrique.

Comme l&#039;as dit Roger Dingledine, lors du 26C3 : &lt;a href=&quot;http://events.ccc.de/congress/2009/Fahrplan/events/3554.en.html&quot; rel=&quot;nofollow&quot;&gt;Tor and censorship: lessons learned&lt;/a&gt;, le problème du p2p dans ces pays est qu&#039;il y a de forte chance que le peer d&#039;en face soit un agent du gouvernement ;-)

Donc la seul solution envisagable est de leur fournir un index non censuré et des &lt;a href=&quot;http://www.torproject.org/bridges.html.en&quot; rel=&quot;nofollow&quot;&gt;bridges tor&lt;/a&gt; pour l&#039;accès à l&#039;internet ;-)</description>
		<content:encoded><![CDATA[<p>@mattboll : la réponse officieuse à l&#8217;orale <img src='http://www.csquad.org/wp-includes/images/smilies/icon_wink.gif' alt=';-)' class='wp-smiley' /><br />
Ma réponse officiel, le p2p n&#8217;est pas une solution fiable dans une dictature numèrique.</p>
<p>Comme l&#8217;as dit Roger Dingledine, lors du 26C3 : <a href="http://events.ccc.de/congress/2009/Fahrplan/events/3554.en.html" rel="nofollow">Tor and censorship: lessons learned</a>, le problème du p2p dans ces pays est qu&#8217;il y a de forte chance que le peer d&#8217;en face soit un agent du gouvernement <img src='http://www.csquad.org/wp-includes/images/smilies/icon_wink.gif' alt=';-)' class='wp-smiley' /> </p>
<p>Donc la seul solution envisagable est de leur fournir un index non censuré et des <a href="http://www.torproject.org/bridges.html.en" rel="nofollow">bridges tor</a> pour l&#8217;accès à l&#8217;internet <img src='http://www.csquad.org/wp-includes/images/smilies/icon_wink.gif' alt=';-)' class='wp-smiley' /> </p>
]]></content:encoded>
	</item>
	<item>
		<title>By: cscm</title>
		<link>http://www.csquad.org/2010/01/11/nutch/comment-page-1/#comment-1557</link>
		<dc:creator>cscm</dc:creator>
		<pubDate>Mon, 18 Jan 2010 22:51:44 +0000</pubDate>
		<guid isPermaLink="false">http://www.csquad.org/?p=973#comment-1557</guid>
		<description>@olivier : pour le cluster de tortues c&#039;est chez BOINC ( http://boinc.berkeley.edu/ ) que cela se passe ;-)</description>
		<content:encoded><![CDATA[<p>@olivier : pour le cluster de tortues c&#8217;est chez BOINC ( <a href="http://boinc.berkeley.edu/" rel="nofollow">http://boinc.berkeley.edu/</a> ) que cela se passe <img src='http://www.csquad.org/wp-includes/images/smilies/icon_wink.gif' alt=';-)' class='wp-smiley' /> </p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Olivier</title>
		<link>http://www.csquad.org/2010/01/11/nutch/comment-page-1/#comment-1553</link>
		<dc:creator>Olivier</dc:creator>
		<pubDate>Mon, 18 Jan 2010 19:16:49 +0000</pubDate>
		<guid isPermaLink="false">http://www.csquad.org/?p=973#comment-1553</guid>
		<description>Oui, on s&#039;arrange : je t&#039;envoi tous les mois la moitié de la facture à payer des serveurs (électricité, bande passante, datacenter, admin sys,...). Je ne te fais pas payer le prix d&#039;achat des serveurs, ça te convient ? ;)

Bon, ok, en fait je dois avoir que 3 ou 4 serveurs, à la maison, en comptant les deux NSLU2 ;o) D&#039;ailleurs, tu as un NSLU2 il me semble, ça te dit qu&#039;on fasse un cluster pour faire des calculs scientifiques hyper compliqués ? :)
Les miens sont débridés d&#039;origine à 266MHz!!! :D

Pour l&#039;instant je n&#039;ai pas d&#039;utilité pour Hadoop ou Nutch, mais je garde tes liens sous le coude, ça pourrait servir un jour ou l&#039;autre.</description>
		<content:encoded><![CDATA[<p>Oui, on s&#8217;arrange : je t&#8217;envoi tous les mois la moitié de la facture à payer des serveurs (électricité, bande passante, datacenter, admin sys,&#8230;). Je ne te fais pas payer le prix d&#8217;achat des serveurs, ça te convient ? <img src='http://www.csquad.org/wp-includes/images/smilies/icon_wink.gif' alt=';)' class='wp-smiley' /> </p>
<p>Bon, ok, en fait je dois avoir que 3 ou 4 serveurs, à la maison, en comptant les deux NSLU2 ;o) D&#8217;ailleurs, tu as un NSLU2 il me semble, ça te dit qu&#8217;on fasse un cluster pour faire des calculs scientifiques hyper compliqués ? <img src='http://www.csquad.org/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' /><br />
Les miens sont débridés d&#8217;origine à 266MHz!!! <img src='http://www.csquad.org/wp-includes/images/smilies/icon_biggrin.gif' alt=':D' class='wp-smiley' /> </p>
<p>Pour l&#8217;instant je n&#8217;ai pas d&#8217;utilité pour Hadoop ou Nutch, mais je garde tes liens sous le coude, ça pourrait servir un jour ou l&#8217;autre.</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: cscm</title>
		<link>http://www.csquad.org/2010/01/11/nutch/comment-page-1/#comment-1549</link>
		<dc:creator>cscm</dc:creator>
		<pubDate>Mon, 18 Jan 2010 15:07:39 +0000</pubDate>
		<guid isPermaLink="false">http://www.csquad.org/?p=973#comment-1549</guid>
		<description>@Olivier : une présentation en Français de HADOOOOP http://blog.guiguiabloc.fr/index.php/2009/11/12/hadoop-doop-doop-doop/</description>
		<content:encoded><![CDATA[<p>@Olivier : une présentation en Français de HADOOOOP <a href="http://blog.guiguiabloc.fr/index.php/2009/11/12/hadoop-doop-doop-doop/" rel="nofollow">http://blog.guiguiabloc.fr/index.php/2009/11/12/hadoop-doop-doop-doop/</a></p>
]]></content:encoded>
	</item>
	<item>
		<title>By: mattboll</title>
		<link>http://www.csquad.org/2010/01/11/nutch/comment-page-1/#comment-1548</link>
		<dc:creator>mattboll</dc:creator>
		<pubDate>Mon, 18 Jan 2010 13:41:53 +0000</pubDate>
		<guid isPermaLink="false">http://www.csquad.org/?p=973#comment-1548</guid>
		<description>Pas mal, mais pourquoi ne pas t&#039;être penché sur yacy, qui il me semble est plus pertinent pour de l&#039;auto-hébergement chez un particulier ?</description>
		<content:encoded><![CDATA[<p>Pas mal, mais pourquoi ne pas t&#8217;être penché sur yacy, qui il me semble est plus pertinent pour de l&#8217;auto-hébergement chez un particulier ?</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: cscm</title>
		<link>http://www.csquad.org/2010/01/11/nutch/comment-page-1/#comment-1542</link>
		<dc:creator>cscm</dc:creator>
		<pubDate>Mon, 18 Jan 2010 10:17:49 +0000</pubDate>
		<guid isPermaLink="false">http://www.csquad.org/?p=973#comment-1542</guid>
		<description>@Olivier : si tu as les 450 000 serveurs, je te donne ma clé ssh et on s&#039;arrange ? ;-)
Pour Hadoop, c&#039;est un framework permettant de distribuées des applications Java. 
Et comme un moteur de recherche est &quot;facilement&quot; parallelizable (ref: http://portal.acm.org/citation.cfm?id=1274975), il faut mettre en place ce type d&#039;outils dans le cas d&#039;une installation répartie sur plusieurs machines.</description>
		<content:encoded><![CDATA[<p>@Olivier : si tu as les 450 000 serveurs, je te donne ma clé ssh et on s&#8217;arrange ? <img src='http://www.csquad.org/wp-includes/images/smilies/icon_wink.gif' alt=';-)' class='wp-smiley' /><br />
Pour Hadoop, c&#8217;est un framework permettant de distribuées des applications Java.<br />
Et comme un moteur de recherche est &#8220;facilement&#8221; parallelizable (ref: <a href="http://portal.acm.org/citation.cfm?id=1274975)" rel="nofollow">http://portal.acm.org/citation.cfm?id=1274975)</a>, il faut mettre en place ce type d&#8217;outils dans le cas d&#8217;une installation répartie sur plusieurs machines.</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Olivier</title>
		<link>http://www.csquad.org/2010/01/11/nutch/comment-page-1/#comment-1534</link>
		<dc:creator>Olivier</dc:creator>
		<pubDate>Sat, 16 Jan 2010 19:33:38 +0000</pubDate>
		<guid isPermaLink="false">http://www.csquad.org/?p=973#comment-1534</guid>
		<description>Pas mal, mais est-ce que tu peux expliquer l&#039;utilisation avec Hadoop ? En effet, je dispose de &quot;450 000 serveurs répartis sur toute la planète&quot;...
Au pire, je peux toujours racheter google et le customiser comme je veux :)

@Eric Schmidt: your face, your ass, what&#039;s the difference? ;)</description>
		<content:encoded><![CDATA[<p>Pas mal, mais est-ce que tu peux expliquer l&#8217;utilisation avec Hadoop ? En effet, je dispose de &#8220;450 000 serveurs répartis sur toute la planète&#8221;&#8230;<br />
Au pire, je peux toujours racheter google et le customiser comme je veux <img src='http://www.csquad.org/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' /> </p>
<p>@Eric Schmidt: your face, your ass, what&#8217;s the difference? <img src='http://www.csquad.org/wp-includes/images/smilies/icon_wink.gif' alt=';)' class='wp-smiley' /> </p>
]]></content:encoded>
	</item>
</channel>
</rss>
