RAHhandleiding

Uit FOK!wiki
Versie door Pirania (overleg | bijdragen) op 2 jan 2010 om 14:06 (Beveiliging "RAHhandleiding" opgeheven)
(wijz) ← Oudere versie | Huidige versie (wijz) | Nieuwere versie → (wijz)
Ga naar: navigatie, zoeken
=Rosetta@home=
Pschaap.gif

Rosetta@home is een wetenschappelijk medisch onderzoekproject dat internet-verbonden computers gebruikt om eiwit-/proteïne-structuren te voorspellen en te ontwerpen en de interactie tussen proteïnes onderzoekt. Het doel is methodes te ontwikkelen die nauwkeurig kunnen voorspellen en ontwerpen van proteïnes. Het uiteindelijke doel is het helpen van onderzoekers bij het ontwikkelen van een geneesmiddel voor menselijke ziekten (zie Human Proteome Folding Project, een samenwerkingsinspanning om onze software op het menselijke genoom toe te passen) zoals onder andere kanker, SARS, HIV/AIDS, malaria,... Al deze onderzoeken gebeuren in samenwerking met de University of Washington. Het project vertrouwt op individuen die hun computer rekencapaciteit schenken, om zo methodes te ontwikkelen deze testen en te verbeteren.

RAH is dus een medisch project maar daar waar anderen proberen om rechtstreeks te zoeken naar medicijnen, gaat het bij Rosetta om de zoektocht om methodes te verbeteren. Bij het project wordt geprobeerd om de uiteindelijke vorm te voorspellen waarin eiwitten zich vouwen. Het uiteindelijke doel is dus ook, maar niet rechtstreeks, om meer te weten komen over het ontstaan van ziektes zoals kanker, SARS, HIV/AIDS, malaria, ...



BOINC

Dit is een opensource platform waarop verschillende projecten gedraaid kunnen worden. Meer uitleg hierover en hoe het te installeren staat bij boinc

Kijk ook eens bij : http://boinc.berkeley.edu/

Wat is Rosetta?

Rosetta is ook een medisch onderzoeksproject dat proteïne structuren probeert te voorspellen en ontwerpen, en de interactie tussen proteïnes onderzoekt. Dit uiteraard met het oog op zo medicijnen en/of genezingsmethodes te ontwikkelen tegen ziektes zoals onder andere kanker, SARS, HIV/AIDS, malaria, ... Op (http://boinc.bakerlab.org/rosetta/rah_research.php) vind je meer uitleg over de precieze werking. Al deze onderzoeken gebeuren in samenwerking met de University of Washington.

Rosetta is een relatief nieuw project, maar heeft al wel iets opgeleverd. De core van het programma (die de voorspellingen en het ontwerp van de proteïne doet) wordt momenteel gebruikt in Robetta (http://robetta.bakerlab.org/). Dit is een publiekelijk beschikbare 'Protein Structure Prediction Server', welke momenteel gratis gebruikt wordt door enkele 100den academische onderzoekers verspreid over de wereld.

Meer info op: http://boinc.bakerlab.org/rosetta/rah_about.php



Installeren Rosetta@Home

Registratie

Een account aanmaken kan op: http://boinc.bakerlab.org/rosetta/create_account_form.php waar je een nickname kan ingeven, maar je wil natuurlijk wel bij de "Dutch Power Cows" terecht komen. Dat kun je later zelf instellen bij je 'account statistics'.

Het kan nog sneller en makelijker via de directe link dan kom je automatisch bij Dutch Power Cows terecht.
Kies een nickname en vul deze als volgt in [DPC]FOKschaap~nickname verder krijg je nog je Email Address, Password het normale gedoe dus (je kunt later eventueel je nick nog veranderen, let wel op het is hoofdletter gevoelig). Je zal een email krijgen met je account ID (random string) bewaar deze mail.

Via de webinterface op http://boinc.bakerlab.org/rosetta/home.php kan je de meeste configuraties van je account afhandelen. (wanneer online, wanneer de client mag draaien etc) Je hebt hier:

  • Eerst de algemene settings
  • Setting specifiek voor Rosetta project
  • Binnen deze settings kan je dan ook nog profielen maken voor gebruik op laptop, thuis-pc, werk...

Als je DPC als team nog niet heb ingesteld kun je dit hier aanpassen en wel bij 'account statistics' klik je op 'find a team'. Vul Dutch in en zoek, hij vind dan: Dutch Power Cows, klik deze aan.

Installeren Boinc & Rosetta

Het beste kun je de pas verder gaan met de installatie als de registratie op de Rosetta website al gedaan is. Het installeren van Boinc staat uitgelegd bij BOINC

Als boinc geinstalleerd is kun je verder gaan met stap 5 -->

  • Stap 5 toevoegen project
Verder moet je ook nog een project toevoegen, in dit geval dus Rosetta@home. Start BOINC en ga naar 'Projecten' - 'Projecten toevoegen' en klik op 'volgende'. Hij wil nu de url hebben van het project, voor Rosetta is dat: http://boinc.bakerlab.org/rosetta/
Daarna wordt je gebruikersnaam en passwoord gevraagd. Als je al een account hebt aangemaakt, kies je voor de 2de optie, use excisting account. Bij het tabblad Projecten van de BOINC client zie ju nu Rosetta@home verschijnen.

(Let op! Het kan zijn dat Proxy settings gevraagd worden, sluit dan BOINC af en check ook even je task manager (ctrl+alt+del) of Boinc.ext of wat van rosetta al draait, zoja sluit deze af en start daarna BOINC weer op. Nu krijg je automatisch een window om een project toe te voegen (zonder proxy instellingen dit keer).

  • Stap 6 jobs
Als het goed is krijg je bij het tabblad 'Work' een queue te zien met minimaal 1 maar soms ook 2 jobs. Het krijgen van jobs kan even duren, je kunt ook handmatig boinc updaten (bij boinc, tabblad projecten, klik op rosetta dan links staat update) waardoor er nieuwe jobs geladen worden. De client gaat nu aan het werk. Een job waarmee hij bezig is heeft de status: Running. Jobs die klaar staan in queue: Ready to run en jobs die klaar zijn: Ready to report.Het versturen van jobs die af zijn gebeurd automatisch, eventueel kun je meteen versturen door ook weer bij 'Projects- Rosetta' op 'update' te klikken.


Als hij geen jobs binnen kan halen check dan even het tabblad 'berichten', als daar staat: 'not enough disk space' dan gaan we deze even toekennen. Hij heeft namelijk een minimale hoeveelheid nodig van 200MB, niet dat hij deze ook maar gebruikt. Ga naar je gebruiker instellingen via de website http://boinc.bakerlab.org/rosetta/home.php, bij 'general preferences' verander je de bij 'Disk and memory usage' in bijvoorbeel 240 (als het maar meer is dan 200). Als hij na een tijdje nog geen jobs heeft, check ook even de status van rosetta bij projects tab, soms moet je 3 a 4 minuten wachten voordat ie weer opnieuw probeerd. Je kunt anders je instellingen op de rosetta website eens nakijken, zie hieronder.

  • Instellingen aanpassen

Voor je gebruikers instellingen ga je naar de website http://boinc.bakerlab.org/rosetta/home.php wel even inloggen als je dat nog niet bent.
Je ziet oa 'Account statistics', check je team op Dutch Power Cows staat, zo nee stel dit dan even in.
Bij 'General-Preferences' kun je verschillende dingen instellen bijvoorbeeld: Do work while computer is in use? als je je computer gebruikt en ook Rosetta wil draaien maak je er yes van maken. Gebruikers met HT kunnen het aantal processors checken en evt aanpassen. Bij het kopje 'Network usage' staat 'Connect to network about every' dit geeft aan hoevaak hij jobs moet inladen. Bij minder vaak zal de queue langer worden. Handig als server eruit ligt of er geen jobs te verdelen zijn.
Wanneer je je instellingen aanpast geeft ie een melding (rode tekst bovenaan) dat de aanpassingen pas effect hebben nadat je computer contact heeft gemaakt met Rosetta@home. Daarom doe je 'update' van Rosetta bij de Projects tab van BOINC.

Punten, Sparen en MegaFlushen

Punten worden berekend aan de hand van de tijd die benodigd was om een job te berekenen, en een score die je processor krijgt. Zie ook http://boinc.berkeley.edu/credit.php
De mogelijkheden van Sparen en MegaFlushen is bij BOINC projecten maar zeer beperkt aanwezig. Jobs van Rosetta hebben (op dit moment) een geldigheidsperiode van 28 dagen. Voorlopig meer info op: APClll in "BOINC client vragen/antwoorden"

Sparen

Er is een beperkte mogelijkheid om te sparen. Allereerst moet je de queue langer maken

  • Ga voor je instellingen naar je Rosetta website
  • Bij 'General Preferences' doe je edit.
  • Je ziet staan bij deeltje 'Network usage': 'Connect to network about every'
  • Wanneer je die meer maakt zal je queue langer worden, vergeet niet na aanpassen van je instellingen BOINC te updaten zodat hij de nieuwe instellingen krijgt (bij 'projects' tab selecteer 'Rosetta' dan links 'update').
  • Nu gaat hij jobs inladen, het kan even duren soms met een korte pauze van 4 min ertussen.
  • Je kunt als je zeker weet dat er geen nieuwe jobs binnenkomen de connectie status op suspend zetten

(rechter knop op bionc in je startbalk of in het boinc menu bij 'commands'.

  • Jobs die af zijn krijgen de satus 'uploading' maar worden niet verstuurd.
  • Om je jobs te versturen moet je de 'Network usage' weer normaal zetten. Daarna eventueel update doen. Het kan zijn dat het versturen in fases gaat met 3 a 4 min ertussen (er worden ook meteen weer nieuwe jobs ingeladen).

Sparen kort samengevat

Paar dingen over sparen:

  • 1.Je queue langer maken doe je door bij je instellingen 'Connect to network about every' meer te maken (max 10 dagen via Rosetta website).
  • 2. Geen jobs versturen: Network connection op suspended zetten (boinc op ' run always' laten staan).
  • 3. Jobs bij-laden zonder versturen: network connection suspended laten staan en bij BOINC Projects-tab update doen... let wel op, hij pakt aantal job adhv wat je bij: Connect to network about every' hebt staan,
    • Opmerking 3a: pak ook niet te veel jobs omdat je na je spaar actie de jobs in je queue nog op tijd moet afkrijgen voor de deadline...
    • Opmerking 3b: check ook waar je computer instellingen op staan (bij view computers: location) default, home, school, work. als je hem op 1van die hebt staan maar niet hebt ingesteld kan hij geen werk krijgen.
  • 4. Versturen: connection weer normaal zetten en update doen.


Diversen

Offline gebruiken

Het is spijtig genoeg niet mogelijk om BOINC op computers te draaien zonder internet verbinding. Dit komt doordat de jobs niet te inporteren en te exporteren zijn via bv. een usb stick.

HT gebruikers

Voor HT users, bij de gebruiker instellingen, 'general preferences', 'processor usage' zie je als het goed is 2 processors staan, je kunt dan 2 jobs tegelijk runnen (of op 1 zetten en maar voor 50% aan dit project werken, kun je ander 50% ander project doen).

Queue instellen

Bij je 'instellingen - network usage' staat: 'connect to network about every'
Dit geeft aan hoevaak BOINC contact maakt om jobs in te laden, dus hoe minder vaak des te groter je ingeladen queue zal zijn. Vergeet niet daarna bij BOINC een update te doen om de wijzigingen door te voeren

Client Monitoren en andere tools

Er zijn al enkele tooltjes ontwikkeld om de clients te monitoren http://boinc.berkeley.edu/download_network.php
Maar ook weer doordat het opensource is, kan je zelf je tools ontwikkelen. Alle informatie over je account/client wordt weggeschreven in xml-files, welke je kan uitlezen. Alle informatie (en beschrijving/lay-out) van deze files, kan je op de BOINC pagina (http://boinc.berkeley.edu/index.php) vinden.

Monitoring-tool : BAM

Boinc Application Manager(BAM) is een monitorings tool dat gebruikt kan worden voor BOINC, dus ook Rosetta. Het programma is zeker handig als je meedere PCs gebruikt, Status-overzicht van alle jobs over meedere systemen. Wat kan het? Het geeft een Status-overzicht van alle systemen. Geeft alle meldingen van BOINC weer. Geeft aantal punten per job (handig bij flush acties). Het kan ook diverse waarschuwingen geven oa bij veel error jobs of erg lange jobs of als de benchmark veel lager uitvalt als normaal.

Installatie BAM

Bij de eerste install zal het programma je locale PC configureren. BOINC maakt gebruik van passwords en configuratiefiles om er voor te zorgen dat niet iedereen jouw BOINC kan besturen. Dus op iedere PC waar je BOINC draait is het bestand GUI_RPC_AUTH.CFG te vinden met een wachtwoord in en het bestand REMOTE_HOSTS.CFG om andere PC's te kunnen gebruiken.

Enkele screenshots van BAM 0.3.0:
job window
projects overview
configuration window

Voor suggesties en bug reports mail naar bamtrubbels=xs4all.nl (of course, replace the = with @)

Geoptimaliseerde client

Sinds 23 augustus 2006 heeft het weinig nut meer om een geoptimaliseerde client te installeren omdat het puntensysteem veranderd is. Kort gezegd komt het erop neer dat de punten die je krijgt, een gemiddelde zijn van de punten die in die WUreeks al toegekend zijn.
Zie ook de engelse tekst hieronder zoals die op de Rosetta site staat:
"August 23, 2006 We have officially switched over to a new crediting system that grants credit based on the amount of structures produced by your computer. Under the new system, the amount of credit awarded per structure for a particular work unit is determined by the average amount of credit claimed per structure using the standard BOINC credit metric over all Rosetta@home runs of that work unit to date. For each work unit type, we keep track of the total amount of claimed credits and structures from valid results returned by hosts, and we use these running totals to determine the amount of credit to award per structure. So if your computer returns 2 structures, the amount of credit awarded would be 2 * total_claimed_credit / total_structures where total_claimed_credit and total_structures are the sum of the claimed credits and structures from valid results returned by all hosts prior to your returned result for that particular work unit type, respectively. The first returned result will be awarded the claimed credit, the second returned result will get the average claimed credit per structure between the two multiplied by the number of structures returned by the result, the third returned result will get the average claimed credit per structure between the three multiplied by the number of structures returned by the result, and so forth. Under the same time frame, a faster computer will produce more structures than a slower computer and thus will be awarded more credits per cpu time."

De onderstaande informatie is van voor de verandering in het puntensysteem:
Als je projecten hebt draaien op het BOINC platform, zoals Rosetta@home, dan heeft het nut om een cpu-geoptimaliseerde BOINC client te installeren. Doordat de standaard Boinc client geen rekening houdt met processor specifieke mogelijkheden krijg je met een aantal processoren een te lage waardering per cpu tijd. Door een cpu-geoptimaliseerde client te gebruiken corrigeer je die fout. Een geoptimaliseerde BOINC client heeft geen invloed op de snelheid van berekeningen... maar heeft wel effect op de benchmarks. En die zijn bepalend voor de geclaimde punten. Afhankelijk van je processor kan de winst 125% tot 175% zijn. Een geoptimaliseerde client heeft geen invloed op de rekentijd van de jobs enkel de waardering van je CPU waardoor je meer punten krijgt.

De installatie is vrij simpel:
Bepaal eerst welk level SSE je processor gebruikt (bijv. met de freeware utility CPU-Z).

  • Download de bij jouw processor passende client bij truXoft.
  • Kijk eerst wat je Benchmark is bij normale versie, bij BOINC tab commnand ->'run benchmark'
  • Het resultaat staat bij 'message' tab (noteer cq onthou de 2 waardes).
  • Sluit BOINC af en controleer bij de taskmanager of alles van boinc en rosetta is afgesloten.
  • Maak een backup van de boinc dir, (dan kun je verschillende clients proberen)
  • Vervang boinc.exe (+evt andere bestanden) in je boinc map door de geoptimaliseerde client.
  • Start BOINC. De manager bemerkt de nieuwe versie en start een benchmark (anders handmatig doen)
  • De 'measured foating point en integer speed' zou hoger moeten zijn dan eerst.
  • Is dit niet het geval, plaats dan de orginele bestanden terug en probeer een andere client versie.
  • Gebruik de versie die de hoogste totaal score geeft (beide opgeteld).


Links

http://boinc.bakerlab.org/rosetta Rosetta mainsite
http://boinc.berkeley.edu/download.php Boinc download
http://boinc.bakerlab.org/rosetta/home.php Your account website Rosetta
http://users.pandora.be/truyts/BOINC/rosetta.xml RAH info/uitleg
http://boinc.truxoft.com/ Voor geoptimaliseerde BOINC client
http://calbe.dw70.de/boincw.html Voor geoptimaliseerde BOINC client (geeft betere resultaten)

Statistieken

http://boinc.bakerlab.org/rosetta/stats.php Officiïle statistieken
boinc RAH search handig om users te zoeken

RAH stats:
Squeez DPC stats atm very basic RAH stats
Tadah fokschaap stats heeft grafiek mogelijkheden ook voor vergelijk tussen users.

Stats:
BOINC stats overview Alle DPC BOINC projecten
BOINC RAH DPC stats Team Stats voor Dutch Power Cows, update elke 6uur
BOINC RAH team stats Team Statistics, update elke 6 uur?
DPC user stats alle boinc projecten.

Zoals bij de meeste DC-projecten, bestaan er ook bij BOINC geen subteams. Deze moeten dus door de statsbakkers verzorgd worden. Als je dus tot een subteam behoort, dien je je naam via een bepaalde regel op te stellen. Je naam wordt dan: subteam~nickname
Dus bijvoorbeeld: [DPC]FOKschaap~Eronymus
Op deze basis kan een statsbakker dan de subteams en hun respectievelijke leden eruithalen.

Wiki-pagina's

FOKschaap FOKschaap info
OP/FOKschaap Openingspost van forum
BOINC BOINC
FADhandleiding Find-a-Drug, project is afgelopen
FAHhandleiding Folding@Home!!
RAHhandleiding Rosetta@Home!!
WCGhandleiding World Community Grid
Stampede Stampede info Rosetta @home

Problemen? Vragen?

MSN:
IRC: irc.tweakers.net #fokschaap of gebruik applet
of vraag op het forum - of test


Eronymus 5 feb 2006 02:18 (CET)