FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE2214, 530 aa 1>>>pF1KE2214 530 - 530 aa - 530 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.0983+/-0.000662; mu= 17.0612+/- 0.040 mean_var=117.4231+/-23.659, 0's: 0 Z-trim(114.7): 18 B-trim: 0 in 0/51 Lambda= 0.118358 statistics sampled from 15269 (15284) to 15269 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.787), E-opt: 0.2 (0.469), width: 16 Scan time: 4.080 The best scores are: opt bits E(32554) CCDS8301.1 FUT4 gene_id:2526|Hs108|chr11 ( 530) 3839 666.1 2.8e-191 CCDS12153.1 FUT3 gene_id:2525|Hs108|chr19 ( 361) 863 157.8 2e-38 CCDS12154.1 FUT5 gene_id:2527|Hs108|chr19 ( 374) 855 156.4 5.2e-38 CCDS12152.1 FUT6 gene_id:2528|Hs108|chr19 ( 359) 850 155.6 9.2e-38 CCDS7022.1 FUT7 gene_id:2529|Hs108|chr9 ( 342) 732 135.4 1e-31 CCDS5033.1 FUT9 gene_id:10690|Hs108|chr6 ( 359) 659 122.9 6e-28 >>CCDS8301.1 FUT4 gene_id:2526|Hs108|chr11 (530 aa) initn: 3839 init1: 3839 opt: 3839 Z-score: 3547.6 bits: 666.1 E(32554): 2.8e-191 Smith-Waterman score: 3839; 99.8% identity (100.0% similar) in 530 aa overlap (1-530:1-530) 10 20 30 40 50 60 pF1KE2 MRRLWGAARKPSGAGWEKEWAEAPQEAPGAWSGRLGPGRSGRKGRAVPGWASWPAHLALA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 MRRLWGAARKPSGAGWEKEWAEAPQEAPGAWSGRLGPGRSGRKGRAVPGWASWPAHLALA 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 ARPARHLGGAGQGPRPLHSGTAPFHSRASGERQRRLEPQLQHESRCRSSTPADAWRAEAA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 ARPARHLGGAGQGPRPLHSGTAPFHSRASGERQRRLEPQLQHESRCRSSTPADAWRAEAA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 LPVRAMGAPWGSPTAAAGGRRGWRRGRGLPWTVCVLAAAGLTCTALITYACWGQLPPLPW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 LPVRAMGAPWGSPTAAAGGRRGWRRGRGLPWTVCVLAAAGLTCTALITYACWGQLPPLPW 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE2 ASPTPSRPVGVLLWWEPFGGRDSAPRPPPDCRLRFNISGCRLLTDRASYGEAQAVLFHHR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 ASPTPSRPVGVLLWWEPFGGRDSAPRPPPDCRLRFNISGCRLLTDRASYGEAQAVLFHHR 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE2 DLVKGPPDWPPPWGVQAHTAEEVDLRVLDYEEAAAAAEALATSSPRPPGQRWVWMNFESP ::::::::::::::.::::::::::::::::::::::::::::::::::::::::::::: CCDS83 DLVKGPPDWPPPWGIQAHTAEEVDLRVLDYEEAAAAAEALATSSPRPPGQRWVWMNFESP 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE2 SHSPGLRSLASNLFNWTLSYRADSDVFVPYGYLYPRSHPGDPPSGLAPPLSRKQGLVAWV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 SHSPGLRSLASNLFNWTLSYRADSDVFVPYGYLYPRSHPGDPPSGLAPPLSRKQGLVAWV 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE2 VSHWDERQARVRYYHQLSQHVTVDVFGRGGPGQPVPEIGLLHTVARYKFYLAFENSQHLD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 VSHWDERQARVRYYHQLSQHVTVDVFGRGGPGQPVPEIGLLHTVARYKFYLAFENSQHLD 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE2 YITEKLWRNALLAGAVPVVLGPDRANYERFVPRGAFIHVDDFPSASSLASYLLFLDRNPA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 YITEKLWRNALLAGAVPVVLGPDRANYERFVPRGAFIHVDDFPSASSLASYLLFLDRNPA 430 440 450 460 470 480 490 500 510 520 530 pF1KE2 VYRRYFHWRRSYAVHITSFWDEPWCRVCQAVQRAGDRPKSIRNLASWFER :::::::::::::::::::::::::::::::::::::::::::::::::: CCDS83 VYRRYFHWRRSYAVHITSFWDEPWCRVCQAVQRAGDRPKSIRNLASWFER 490 500 510 520 530 >>CCDS12153.1 FUT3 gene_id:2525|Hs108|chr19 (361 aa) initn: 828 init1: 401 opt: 863 Z-score: 803.4 bits: 157.8 E(32554): 2e-38 Smith-Waterman score: 896; 43.7% identity (65.1% similar) in 350 aa overlap (184-528:57-360) 160 170 180 190 200 210 pF1KE2 CVLAAAGLTCTALITYACWGQLPPLPWASPTPSRPVGVLLW--WEPFGGRDSAPRPPPDC ::.::. ..: : :: : : CCDS12 AVCFFSYLRVSRDDATGSPRAPSGSSRQDTTPTRPTLLILLRTW-PF----HIPVALSRC 30 40 50 60 70 80 220 230 240 250 260 270 pF1KE2 -RLRFNISGCRLLTDRASYGEAQAVLFHHRDLVKGPPDWPPPWGVQAHTAEEVDLRVLDY .. . . :.. .:: : .:. :. :: :....: . :: CCDS12 SEMVPGTADCHITADRKVYPQADMVIVHHWDIMSNPKSRLPP------------------ 90 100 110 120 280 290 300 310 320 330 pF1KE2 EEAAAAAEALATSSPRPPGQRWVWMNFESPSHSPGLRSLASNLFNWTLSYRADSDVFVPY :::: ::::.:.:.: : . :..: . :: :.:::.:::.:.:: CCDS12 -------------SPRPQGQRWIWFNLEPPPNCQHLEAL-DRYFNLTMSYRSDSDIFTPY 130 140 150 160 340 350 360 370 380 pF1KE2 GYLYPRS-HPGDPPSGLAPPLSRKQGLVAWVVSHWDERQARVRYYHQLSQHVTVDVFGRG :.: : : .:. :: . :: : ::::.::.: .::::::..:. :. :::.::. CCDS12 GWLEPWSGQPAHPPLN----LSAKTELVAWAVSNWKPDSARVRYYQSLQAHLKVDVYGRS 170 180 190 200 210 220 390 400 410 420 430 440 pF1KE2 GPGQPVPEIGLLHTVARYKFYLAFENSQHLDYITEKLWRNALLAGAVPVVLGPDRANYER .:.:. ...:..::::::::::: : :::::::::::: : ::::::::.:.:::: CCDS12 H--KPLPKGTMMETLSRYKFYLAFENSLHPDYITEKLWRNALEAWAVPVVLGPSRSNYER 230 240 250 260 270 280 450 460 470 480 490 500 pF1KE2 FVPRGAFIHVDDFPSASSLASYLLFLDRNPAVYRRYFHWRRSYAVHITSF-WDEPWCRVC :.: :::::::: : ..:: :: ::.. : : ::.::.. .. :: : .:..: CCDS12 FLPPDAFIHVDDFQSPKDLARYLQELDKDHARYLSYFRWRET--LRPRSFSWALDFCKAC 290 300 310 320 330 340 510 520 530 pF1KE2 QAVQRAGDRPKSIRNLASWFER .:. . : ...:..:.:: CCDS12 WKLQQES-RYQTVRSIAAWFT 350 360 >>CCDS12154.1 FUT5 gene_id:2527|Hs108|chr19 (374 aa) initn: 854 init1: 411 opt: 855 Z-score: 795.8 bits: 156.4 E(32554): 5.2e-38 Smith-Waterman score: 917; 44.3% identity (66.3% similar) in 350 aa overlap (184-528:70-373) 160 170 180 190 200 210 pF1KE2 CVLAAAGLTCTALITYACWGQLPPLPWASPTPSRP-VGVLLWWEPFGGRDSAPRPPPDC- ::..: . .::: :: ..: : : CCDS12 DATGSPRPGLMAVEPVTGAPNGSRCQDSMATPAHPTLLILLWTWPF----NTPVALPRCS 40 50 60 70 80 90 220 230 240 250 260 270 pF1KE2 RLRFNISGCRLLTDRASYGEAQAVLFHHRDLVKGPP-DWPPPWGVQAHTAEEVDLRVLDY .. . . : . .: . : .:.::. :: :.. .: . ::: CCDS12 EMVPGAADCNITADSSVYPQADAVIVHHWDIMYNPSANLPPP------------------ 100 110 120 130 280 290 300 310 320 330 pF1KE2 EEAAAAAEALATSSPRPPGQRWVWMNFESPSHSPGLRSLASNLFNWTLSYRADSDVFVPY :: ::::.:...::::. :..: .. :: :.:::.:::.:.:: CCDS12 --------------TRPQGQRWIWFSMESPSNCRHLEAL-DGYFNLTMSYRSDSDIFTPY 140 150 160 170 180 340 350 360 370 380 pF1KE2 GYLYPRS-HPGDPPSGLAPPLSRKQGLVAWVVSHWDERQARVRYYHQLSQHVTVDVFGRG :.: : : .:. :: . :: : ::::.::.: .::::::..:. :. :::.::. CCDS12 GWLEPWSGQPAHPPLN----LSAKTELVAWAVSNWKPDSARVRYYQSLQAHLKVDVYGRS 190 200 210 220 230 390 400 410 420 430 440 pF1KE2 GPGQPVPEIGLLHTVARYKFYLAFENSQHLDYITEKLWRNALLAGAVPVVLGPDRANYER .:.:. ...:..::::::::::: : :::::::::::: : ::::::::.:.:::: CCDS12 H--KPLPKGTMMETLSRYKFYLAFENSLHPDYITEKLWRNALEAWAVPVVLGPSRSNYER 240 250 260 270 280 290 450 460 470 480 490 500 pF1KE2 FVPRGAFIHVDDFPSASSLASYLLFLDRNPAVYRRYFHWRRSYAVHITSF-WDEPWCRVC :.: :::::::: : ..:: :: ::.. : : :::::.. .. :: : .:..: CCDS12 FLPPDAFIHVDDFQSPKDLARYLQELDKDHARYLSYFHWRET--LRPRSFSWALAFCKAC 300 310 320 330 340 350 510 520 530 pF1KE2 QAVQRAGDRPKSIRNLASWFER .:. . : ...:..:.:: CCDS12 WKLQQES-RYQTVRSIAAWFT 360 370 >>CCDS12152.1 FUT6 gene_id:2528|Hs108|chr19 (359 aa) initn: 843 init1: 401 opt: 850 Z-score: 791.4 bits: 155.6 E(32554): 9.2e-38 Smith-Waterman score: 898; 43.5% identity (64.9% similar) in 359 aa overlap (173-528:47-358) 150 160 170 180 190 200 pF1KE2 WRRGRGLPWTVCVLAAAGLTCTALITYACWGQLPPLPWASPTPSRPVGVLLWWEPFGGRD :. : ..:. : :. .::: :: CCDS12 LTTLLFQLLMAVCFFSYLRVSQDDPTVYPNGSRFPDSTGTPAHSIPL-ILLWTWPF---- 20 30 40 50 60 70 210 220 230 240 250 260 pF1KE2 SAPRPPPDC-RLRFNISGCRLLTDRASYGEAQAVLFHHRDLVKGPPDWPPPWGVQAHTAE . : : : .. . . : . .:: : .:.::. :::... .: : CCDS12 NKPIALPRCSEMVPGTADCNITADRKVYPQADAVIVHHREVMYNPSAQLP---------- 80 90 100 110 120 270 280 290 300 310 320 pF1KE2 EVDLRVLDYEEAAAAAEALATSSPRPPGQRWVWMNFESPSHSPGLRSLASNLFNWTLSYR ::: ::::.:...::::: :... .. :: :.::: CCDS12 ---------------------RSPRRQGQRWIWFSMESPSHCWQLKAM-DGYFNLTMSYR 130 140 150 330 340 350 360 370 380 pF1KE2 ADSDVFVPYGYLYPRS-HPGDPPSGLAPPLSRKQGLVAWVVSHWDERQARVRYYHQLSQH .:::.:.:::.: : : .:. :: .: : : ::::.::.: .::::::..:. : CCDS12 SDSDIFTPYGWLEPWSGQPAHPPLNL----SAKTELVAWAVSNWGPNSARVRYYQSLQAH 160 170 180 190 200 210 390 400 410 420 430 440 pF1KE2 VTVDVFGRGGPGQPVPEIGLLHTVARYKFYLAFENSQHLDYITEKLWRNALLAGAVPVVL . :::.::. .:.:. ...:..::::::::::: : :::::::::::: : :::::: CCDS12 LKVDVYGRS--HKPLPQGTMMETLSRYKFYLAFENSLHPDYITEKLWRNALEAWAVPVVL 220 230 240 250 260 270 450 460 470 480 490 pF1KE2 GPDRANYERFVPRGAFIHVDDFPSASSLASYLLFLDRNPAVYRRYFHWRRSYAVHITSF- ::.:.:::::.: :::::::: : ..:: :: ::.. : : ::.::.. .. :: CCDS12 GPSRSNYERFLPPDAFIHVDDFQSPKDLARYLQELDKDHARYLSYFRWRET--LRPRSFS 280 290 300 310 320 330 500 510 520 530 pF1KE2 WDEPWCRVCQAVQRAGDRPKSIRNLASWFER : .:..: .:. . : .. :..:.:: CCDS12 WALAFCKACWKLQEES-RYQT-RGIAAWFT 340 350 >>CCDS7022.1 FUT7 gene_id:2529|Hs108|chr9 (342 aa) initn: 763 init1: 354 opt: 732 Z-score: 682.8 bits: 135.4 E(32554): 1e-31 Smith-Waterman score: 928; 44.3% identity (62.9% similar) in 388 aa overlap (144-529:10-341) 120 130 140 150 160 170 pF1KE2 AWRAEAALPVRAMGAPWGSPTAAAGGRRGWRRGRGLPWTVCVLAAAGLTCTALITYACWG :: ::: :::...: .:: . : CCDS70 MNNAGHGPTRRLRGLG----VLAGVALL-AAL--WLLW- 10 20 30 180 190 200 210 220 230 pF1KE2 QLPPLPWASPTPSRPVGVLLWWEPFGGRDSAPRPPPDCRLRFNISGCRLLTDRASYGEAQ : : ..:.:. . .:.: :: :. :. : : :..:. :.: ..:. . :. CCDS70 LLGSAPRGTPAPQPTITILVWHWPF--TDQPPELPSDTCTRYGIARCHLSANRSLLASAD 40 50 60 70 80 240 250 260 270 280 290 pF1KE2 AVLFHHRDLVKGPPDWPPPWGVQAHTAEEVDLRVLDYEEAAAAAEALATSSPRPPGQRWV ::.::::.: : :: :: :: :: CCDS70 AVVFHHRELQTRRSHLP-----------------------------LA---QRPRGQPWV 90 100 110 300 310 320 330 340 350 pF1KE2 WMNFESPSHSPGLRSLASNLFNWTLSYRADSDVFVPYGYLYPRSHPGDPPSGLAPPLSRK : ..:::::. :: : ..:::.:::: :::.::::: : : : : :: ::: : CCDS70 WASMESPSHTHGLSHL-RGIFNWVLSYRRDSDIFVPYGRLEP--HWG--PS---PPLPAK 120 130 140 150 160 360 370 380 390 400 410 pF1KE2 QGLVAWVVSHWDERQARVRYYHQLSQHVTVDVFGRGGPGQPVPEIGLLHTVARYKFYLAF . ..:::::...::: :.: :.::. :. ::::::.. :.:. :. :::.:.:::.: CCDS70 SRVAAWVVSNFQERQLRARLYRQLAPHLRVDVFGRAN-GRPLCASCLVPTVAQYRFYLSF 170 180 190 200 210 220 420 430 440 450 460 470 pF1KE2 ENSQHLDYITEKLWRNALLAGAVPVVLGPDRANYERFVPRGAFIHVDDFPSASSLASYLL ::::: ::::::.:::::.::.::::::: ::.:: ::: ::.::::: :: ::..: CCDS70 ENSQHRDYITEKFWRNALVAGTVPVVLGPPRATYEAFVPADAFVHVDDFGSARELAAFLT 230 240 250 260 270 280 480 490 500 510 520 530 pF1KE2 FLDRNPAVYRRYFHWRRSYAVHITSFWDEPWCRVCQAVQRAGDRPKS--IRNLASWFER . : . :.:.: :: :.. . : : .: .: .: :.: ..: .::. CCDS70 GM--NESRYQRFFAWRDRLRVRLFTDWRERFCAIC---DRYPHLPRSQVYEDLEGWFQA 290 300 310 320 330 340 >>CCDS5033.1 FUT9 gene_id:10690|Hs108|chr6 (359 aa) initn: 849 init1: 285 opt: 659 Z-score: 615.2 bits: 122.9 E(32554): 6e-28 Smith-Waterman score: 858; 41.7% identity (65.4% similar) in 338 aa overlap (191-528:66-357) 170 180 190 200 210 220 pF1KE2 LTCTALITYACWGQLPPLPWASPTPSRPVGVLLWWEPFGGRDSAPRPPPDCRLRFNISGC .:.: ::: . .:. :::.:: CCDS50 WIFSPMESASSVLKMKNFFSTKTDYFNETTILVWVWPFGQTFDLT----SCQAMFNIQGC 40 50 60 70 80 90 230 240 250 260 270 280 pF1KE2 RLLTDRASYGEAQAVLFHHRDLVKGPPDWPPPWGVQAHTAEEVDLRVLDYEEAAAAAEAL .: :::. :....:::.::::. .: :: : . CCDS50 HLTTDRSLYNKSHAVLIHHRDI-----SW--------------DLTNLPQQA-------- 100 110 120 290 300 310 320 330 340 pF1KE2 ATSSPRPPGQRWVWMNFESPSHSPGLRSLASNLFNWTLSYRADSDVFVPYGYLYPRSHPG ::: :.:.:::.:::.:.: .: .::: ::.:: :::. ::::.: ..: CCDS50 -----RPPFQKWIWMNLESPTHTPQ-KSGIEHLFNLTLTYRRDSDIQVPYGFLTVSTNP- 130 140 150 160 170 350 360 370 380 390 400 pF1KE2 DPPSGLAPPLSRKQGLVAWVVSHWDERQARVRYYHQLSQHVTVDVFGRGGPGQPVPEIGL .. . :. :: ::::.:. ..:::.::..::. . . ..:.. :. : . .: CCDS50 -----FVFEVPSKEKLVCWVVSNWNPEHARVKYYNELSKSIEIHTYGQAF-GEYVNDKNL 180 190 200 210 220 230 410 420 430 440 450 460 pF1KE2 LHTVARYKFYLAFENSQHLDYITEKLWRNALLAGAVPVVLGPDRANYERFVPRGAFIHVD . :.. ::::.:::: : :::::::. ::.:::.:::::::.: ::: ..: .::::. CCDS50 IPTISTCKFYLSFENSIHKDYITEKLY-NAFLAGSVPVVLGPSRENYENYIPADSFIHVE 240 250 260 270 280 290 470 480 490 500 510 520 pF1KE2 DFPSASSLASYLLFLDRNPAVYRRYFHWRRSYAVHITSFWDEPWCRVCQAVQRAGDRPKS :. : : ::.:: .:.: .: ::.::....:.. ::. : .:. :.: . :: CCDS50 DYNSPSELAKYLKEVDKNNKLYLSYFNWRKDFTVNLPRFWESHACLACDHVKRHQEY-KS 300 310 320 330 340 530 pF1KE2 IRNLASWFER . :: .:: CCDS50 VGNLEKWFWN 350 530 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Mon Nov 7 15:45:41 2016 done: Mon Nov 7 15:45:42 2016 Total Scan time: 4.080 Total Display time: 0.030 Function used was FASTA [36.3.4 Apr, 2011]