Saturday 21 October 2017

Latency In Handelssystemer


BarsMonster: Jeg kunne se om ting som nettverksstabler, som er helt plattformavhengige, ville kreve litt kunnskap før de kunne bytte plattformer. Pluss ting som gaffel som er vanlige i POSIX verden, men er ikke mulige i et Windows-miljø. Jeg tror det er et rimelig svar. ndash Billy ONeal Aug 29 10 på 0:55 LinuxUNIX er mye mer anvendelig for samtidige eksterne brukere, noe som gjør det enklere å skanne rundt systemene, bruke standardverktøy som grepsedawkperlrubyless på logger. sshscp. alt det som bare er der. Det er også tekniske problemer, for eksempel: for å måle forløpt tid på Windows kan du velge mellom et sett med funksjoner basert på Windows-klokkeflikket og den maskinvarebaserte QueryPerformanceCounter (). Den første er trinn hver 10 til 16 millisekunder (merknad: Enkel dokumentasjon innebærer mer presisjon - for eksempel verdiene fra GetSystemTimeAsFileTime () måles til 100ns, men de rapporterer samme 100ns kanten av klokken, til den krysser igjen). Sistnevnte - QueryPerformanceCounter () - har show-stopper problemer der forskjellige corescpus kan rapportere klokker siden starten som varierer med flere sekunder på grunn av oppvarming på forskjellige tidspunkter under systemstart. MSDN dokumenterer dette som en mulig BIOS-feil, men det er vanlig. Så, hvem ønsker å utvikle systemer med lav latenshandel på en plattform som ikke kan instrumenteres riktig (Det finnes løsninger, men du vil ikke finne noen programvare som sitter beleilig i boost eller ACE). Mange LinuxUNIX-varianter har mange enkle, parametre parametere for å eliminere ventetid for en enkelt hendelse mot gjennomsnittlig ventetid under belastning, tidsskala størrelser, planleggingspolicyer osv. På open source operativsystemer er det også den forsikringen som følger med å kunne referere til kode når du tror noe skal være raskere enn det er, og kunnskapen om at et (potensielt stort) samfunn av mennesker har vært og gjør det så kritisk - med Windows vil det åpenbart hovedsakelig være folkens hoder som er tildelt for å se på det. På FUDreputation-siden - noe immateriell, men en viktig del av grunnene til OS-valg - tror jeg at de fleste programmerere i bransjen bare vil stole på LinuxUNIX mer for å gi pålitelig planlegging og oppførsel. Videre har LinuxUNIX et rykte for å krasje mindre, selv om Windows er ganske pålitelig i disse dager, og Linux har en mye mer flyktig kodebase enn Solaris eller FreeBSD. besvart 29. august kl 10:42 Windows-klientens operativsystem tillater bare en person å bruke RDP om gangen. Men Windows Terminal Server har eksistert for alltid (det var faktisk den opprinnelige bruken av RDP) og det tillater så mange tilkoblinger som du har Client Access Licenses. Windows Server-operativsystemer har muligheten til å ha mer enn én ekstern bruker som standard. Hvis du kunne kilden kommentaren om planlegging, ville jeg 1 her - den delen av svaret synes å være FUD på dette punktet til meg (resten av svaret er bra). YMMV. ndash Billy ONeal Aug 29 10 på 0:50 Det er ingen UNIXLinux planlegging. Det er et av områdene der implementeringer er forskjellige. Og Linux har faktisk hatt mer enn ett planlegger valg (google helt rettferdig planlegger Linux for bakgrunn), så du kan ikke engang si at quotLinux planlegging er reliablequot. ndash MSalters 30 aug 10 klokka 11:37 Jeg andre meninger om historisk og tilgang til kjernemanipulering. Bortsett fra disse grunnene tror jeg også at akkurat som hvordan de slår av søppelsamling av og lignende mekanisme i Java når du bruker disse teknologiene i litt lav latens. De kan unngå Windows på grunn av APIene på høyt nivå som virker sammen med lavt nivå os og deretter kjernen. Så kjernen er selvfølgelig kjernen som kan interagere med å bruke lavt nivå os. API-ene på høyt nivå er gitt bare for å gjøre de vanlige brukerne enklere. Men i tilfelle av lav latens viser dette seg å være et fettlag og brøkdelers tap av hver operasjon. Så et lukrativt alternativ for å få noen brøkdeler per samtale. Bortsett fra dette er en annen ting å vurdere integrasjon. De fleste servere, datasentre, utvekslinger bruker UNIX ikke Windows, slik at bruk av klienter fra samme familie gjør integrasjonen og kommunikasjonen enklere. Da har du sikkerhetsproblemer (mange mennesker der ute, kanskje ikke enig med dette punktet) Hacking UNIX er ikke lett i forhold til hacking av Windows. Jeg er ikke enig Lisensiering må være problemet for banker fordi de bruser penger på hver eneste maskinvare og programvare og de som tilpasser dem, så kjøp av lisenser vil ikke være like større problemet når de vurderer hva de får ved å kjøpe. besvart des 21 12 kl 20:05 Ditt svar 2017 Stack Exchange, IncCambridge, UK ndash 23. juni 2014 ndash Argon Design. et designtjenester selskap som spesialiserer seg på komplekse digitale systemer kunngjorde i dag at den har utviklet et ekstremt lavt ventetid finansielt handelssystem for et proprietært handelshus som gjør latensarbitrage på en av de ledende børsene i Amerika. Den fulle handelsplattformen som inkluderer funksjoner fra sanntids markedsdatainntak gjennom algoritmstøtte til FIX-basert ordreplassering, gikk live i mai 2014. Den bygger på de banebrytende resultatene Argon kunngjorde i september 2013 for high performance trading ved hjelp av en hybriddesign av FPGA og x86 teknologier. Dette kombinerer raske baner implementert i FPGA for å gi nanosekundnivå tick-to-trade-svar på viktige hendelser sammen med mulighetsoppsett, parameterbestemmelse og systemadministrasjon på en høy ytelse x86-server. Det beste av racerhardware består av en Supermicro Hyper-Speed-server med Dual Intel Xeon E5-prosessorer samlet og levert av Bios IT, samt en Arista 7124FX-bryter med integrert Stratix V FPGA. FPGA-logikken bruker en rekke optimeringsteknikker utviklet av Argon for å maksimere hastighetsfordelen. Disse inkluderer in-line parsing, forkjøp, inngrep og gateway voldgift. For å drive de ulike inferanseteknikkene, inkluderer FPGA kompleks logikk for å bygge og vedlikeholde ordbøker og statistikk. FASTFIX-parsing er ferdig på høyst 64n, og bestillingsboksbygging er fullført i 32ns. For de laveste latensnetsgrensesnittene bruker systemet Tamba Networksrsquo terminal latens 1G MAC. Den administrerende partneren til handelshuset kommenterte Da bytte blir mer deterministisk, er det viktig å ha en plattform som gir en rask fordel, samt smarte handelsstrategier. Argon-systemet har gitt oss den kanten. Steve Barlow, CTO for Argon Design kommenterte High performance trading fortsetter å være aktiv på tvers av verdensomspennende markeder. Som det uten tvil blir mer nisje, vil å vinne ha tilgang til både høyytende teknologier og ferdighetene til å velge og sette sammen de nødvendige delene. På Argon tror vi på detaljene i spesialisert engineering ndash er hver kunde forskjellig og dermed utvikler vi skreddersydde systemer som gir vitale kanten. Om Argon Design Argon Design ble grunnlagt i 2009 og opererer i hjertet av den verdensberømte Cambridge Technology Cluster med tilgang til markedets ledende intellekt. I den finansielle handelssektoren bistår Argon Design internt team ved å gi spesialkompetanse eller tilleggsressurser til prosjekter, samt komplette skreddersydde design på områder som: Heterogen maskinvare og programvare systemarkitektur Appliance design og produksjon FPGA-basert utviklingsprogrammering Mange kjerner prosessor maskinvare og programvare design ved hjelp av Tilera, Intel og andre Nettverksbehandling GPU utviklingsprogrammering og OpenCLAll tiden du hører om høyfrekvent handel (HFT) og hvor jævla rask algoritmen er. Men jeg lurer på - hva er rask i disse dager Jeg tenker ikke på latens forårsaket av den fysiske avstanden mellom en utveksling og serveren som driver en handelsapplikasjon, men latensen introdusert av selve programmet. For å være mer spesifikk: Hva er tiden fra hendelser som kommer på ledningen i et program til det programmet, utsender et ordrepris på ledningen I. e. tick-to-trade tid. Taler vi under millisekund Eller sub-mikrosekund Hvordan oppnår disse latensene Koding i montering FPGAs Godt gammelt C-kode Theres har nylig blitt publisert en interessant artikkel om ACM, som gir mange detaljer til dagens HFT-teknologi, noe som er en utmerket lesning : quotOn wirequot er en fuzzy grense. Det tar tid for en komplett datapakke å ankomme, og noen av behandlingen kan allerede ha startet før hele meldingen er mottatt. Alt er skjevt gjennom de forskjellige lagene i minnesystemet og kjernen og applikasjonen, og folk legger stor vekt på det skråt. ndash sh1 Jul 1 13 kl 12:49 Im CTO av et lite selskap som lager og selger FPGA-baserte HFT-systemer. Ved å bygge våre systemer på toppen av Solarflare Application Onload Engine (AOE) har vi konsekvent levert ventetid fra en interessant markedshendelse på ledningen (10GbS UDP markedsdatainnmatning fra ICE eller CME) til den første byten av den resulterende ordremeddelelsen som rammer ledningen i 750 til 800 nanosekunder (ja, sub-mikrosekund). Vi forventer at våre neste versjonssystemer vil ligge i 704 til 710 nanosekunder. Noen mennesker har hevdet noe mindre, men det er i et laboratoriemiljø og egentlig ikke sitter ved en COLO i Chicago og rydder ordrene. Kommentarene om fysikk og lysets hastighet er gyldige, men ikke relevante. Alle som er seriøse om HFT har sine servere på en COLO i rommet ved siden av utvekslingsserveren. For å komme inn i dette submikrosekdomsdomenet kan du ikke gjøre veldig mye på verts CPU, bortsett fra implementeringskommandoer til FPGA, selv med teknologier som kjerneomkobling har du 1,5 mikrosekunder av uunngåelig overhead. så i dette domenet spiller alt sammen med FPGAer. En av de andre svarene er veldig ærlig å si at i dette svært hemmelige markedet snakker svært få mennesker om verktøyene de bruker eller deres ytelse. Hver enkelt av våre kunder krever at vi ikke engang forteller noen at de bruker verktøyene våre, eller avslører noe om hvordan de bruker dem. Dette gjør ikke bare markedsføring hardt, men det hindrer egentlig den gode flyt av teknisk kunnskap mellom jevnaldrende. På grunn av dette behovet for å komme seg inn i eksotiske systemer for den onde, raske delen av markedet, vil du oppdage at Quants (folkene som kommer opp med algoritmer som vi lager går fort) deler deres algos i event-to-response time lag. Øverst på teknologipakken er submikrosekundene (som våre). Det neste laget er de tilpassede C-systemene som gjør stor bruk av kjernebypass og de er i 3-5 mikrosekunder. Det neste laget er folkene som ikke har råd til å være på en 10GbS-kabel, bare én router hopp fra utvekslingen, de kan fortsatt være hos FOLOer, men på grunn av et styggt spill kaller vi portroulett de i dusinvis til hundrevis av mikrosekdomsdomener. Når du kommer inn i millisekunder, er det nesten ikke HFT lenger. Mercury-Minerva, du nevner 39latency fra en quotinterestingquot markedshendelse på wire39 og FPGAs. Jeg lurte på om det finnes byte-orienterte Ethernet-NICer for å unngå 1-rammes latens tvunget av typiske NIC-er (som er minst 67 ns i 10GbE). Vil du vite ndash hmijail 27 januar kl 14:58 God artikkel som beskriver hva som er tilstanden til HFT (i 2011) og gir noen eksempler på maskinvareløsninger som gjør nanosekunder oppnåelige: Wall Streets Need for Trading Hastighet: Nanosekundalderen Med løpet For den laveste ventetiden fortsetter, snakker noen markedsdeltakere om piktosekundstrilljoner av et sekund. EDIT: Som Nicholas vennligst nevnt: Linken nevner et firma, Fixnetix, som kan forberede en handel i 740ns (det vil si tiden fra en inngangshendelse oppstår når en ordre sendes). besvart 1. juli kl 9:03 sll 41.4k 9679 10 9679 66 9679 115 Linken nevner et selskap, Fixnetix, som kan utarbeide en tradequot i 740ns (det vil si tiden fra en inngangshendelse oppstår til en ordre som sendes). Ndash Nicholas Jul 1 13 kl 12:34 Riktig, dette er viktig punkt. Jeg vil redigere svaret og legge til dette, takk ndash sll 1 juli kl 12:43 I disse dager er enkeltsiffer-til-handel i mikrosekunder baren for konkurrerende HFT-firmaer. Du bør kunne gjøre høye enkelt siffer ved hjelp av kun programvare. Så lt5 usec med ekstra maskinvare. For hva det er verdt, er TIBCOs FTL-meldingsprodukt sub-500 ns for innenfor en maskin (delt minne) og noen få mikro sekunder ved hjelp av RDMA (Remote Direct Memory Access) i et datasenter. Etter det blir fysikk hoveddelen av ligningen. Så det er hastigheten som data kan få fra feed til appen som tar beslutninger. Minst ett system har hevdet 30ns interthread meldingstjenester, som sannsynligvis er en finjustert referanse, så alle som snakker om lavere tall bruker en slags magisk CPU. Når du er i appen, er det bare et spørsmål om hvor raskt programmet kan ta beslutninger.

No comments:

Post a Comment