I would use curl. If there is a login/password, you can then use curl to POST to a URL, create and save a cookie, then grab the page you want to look at. If I recall correctly, the man page is fairly well documented. <br><br>
Good luck!<br><br><div><span class="gmail_quote">On 11/10/07, <b class="gmail_sendername"><a href="mailto:bb.odenthal@gmail.com">bb.odenthal@gmail.com</a></b> &lt;<a href="mailto:bb.odenthal@gmail.com">bb.odenthal@gmail.com
</a>&gt; wrote:</span><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">John,<br><br>I may be over simplifying this but a web &quot;search&quot; is usually just a POST or GET method action on an HTML form.&nbsp;&nbsp;If you can take a packet trace of the transaction (assuming it&#39;s not SSL) then it&#39;s easy to discover the URL format and method for the search.&nbsp;&nbsp;A simple &quot;lynx -dump&quot; of that URL using &quot;watch&quot; every 120 seconds could be helpful (Assuming that a text only version of the web page would be of any use to you):
<br><br>#watch -n 120 &quot;lynx -dump <a href="http://foo.com/search?bar=san_gabriel_valley">http://foo.com/search?bar=san_gabriel_valley</a>&quot;<br><br>If the site requires more interaction than that (login, password, click on a few links, fill out a form) or requires cookies then I suggest using a Perl script.&nbsp;&nbsp;Maybe WWW::Mechanize for some simple HTML form automation.
<br><br>**I&#39;m putting on my Nomex jacket**<br><br>Or...just spend $30 on <a href="http://www.newdigitalsoft.com/airobot/">http://www.newdigitalsoft.com/airobot/</a> or similar and use a windows box?&nbsp;&nbsp; It IS an option.
<br><br>-bb<br>-----Original Message-----<br>From: <a href="mailto:juanslayton@dslextreme.com">juanslayton@dslextreme.com</a><br><br>Date: Sat, 10 Nov 2007 21:37:04<br><a href="mailto:To:sgvlug@sgvlug.net">To:sgvlug@sgvlug.net
</a><br>Subject: [SGVLUG] Polling Web Sites<br><br><br><br>&nbsp;&nbsp;&nbsp;&nbsp; Got a little project here that I could use some help on.&nbsp;&nbsp;El Monte<br>City School District uses a program called Aesop to post daily<br>openings for substitute teachers.&nbsp;&nbsp;All I have to do is go to their
<br>web site and click on the search button and I can see who has<br>currently called in to be absent.&nbsp;&nbsp;Trouble is, if someone calls in<br>sick just after I&#39;ve checked, I won&#39;t find out about it until the<br>next time I check.&nbsp;&nbsp;And I have better things to do than sit and click
<br>on the search button all evening.<br>&nbsp;&nbsp;&nbsp;&nbsp; So I began to figure out ways to poll that site automatically.&nbsp;&nbsp;The<br>current approach works like this:&nbsp;&nbsp;A timing program (written in C)<br>runs in the background on a virtual terminal and produces a negative
<br>pulse on data line 1 of the parallel port every few minutes.&nbsp;&nbsp;I &#39;hot<br>wired&#39; the left click switch (high, pull-down side) of a USB mouse to<br>that data line (through a diode to protect the port in case someone
<br>physically clicks the mouse).&nbsp;&nbsp;By leaving the cursor on the search<br>button, the background program electronically clicks that button<br>every few minutes.&nbsp;&nbsp;All I have to do as I go about my business is<br>glance at the screen every now and then to see if anything new has
<br>come up.<br>&nbsp;&nbsp;&nbsp;&nbsp; But this is over-complicated.&nbsp;&nbsp;There ought to be a simple way to poll<br>that page programatically without messing with the hardware.&nbsp;&nbsp;Say, by<br>using the usb event mechanisms?&nbsp;&nbsp;Like as not somebody somewhere has
<br>already written code to do it.&nbsp;&nbsp;I&#39;d appreciate anyone who could point<br>me in the right direction.<br><br>John<br><br>***************************************************************************************<br>If the mind is not constrained by walls and fences, where is the need for
<br>Windows and Gates?<br></blockquote></div><br><br clear="all"><br>