FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB5805, 471 aa 1>>>pF1KB5805 471 - 471 aa - 471 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 10.8771+/- 0.001; mu= -2.9985+/- 0.061 mean_var=405.3882+/-82.370, 0's: 0 Z-trim(116.8): 14 B-trim: 0 in 0/52 Lambda= 0.063700 statistics sampled from 17408 (17420) to 17408 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.81), E-opt: 0.2 (0.535), width: 16 Scan time: 3.510 The best scores are: opt bits E(32554) CCDS3868.1 IRX2 gene_id:153572|Hs108|chr5 ( 471) 3219 309.4 5.1e-84 CCDS58462.1 IRX5 gene_id:10265|Hs108|chr16 ( 482) 1138 118.2 1.9e-26 CCDS10751.1 IRX5 gene_id:10265|Hs108|chr16 ( 483) 1134 117.8 2.5e-26 CCDS10750.1 IRX3 gene_id:79191|Hs108|chr16 ( 501) 729 80.6 4.1e-15 CCDS34132.1 IRX1 gene_id:79192|Hs108|chr5 ( 480) 607 69.4 9.4e-12 >>CCDS3868.1 IRX2 gene_id:153572|Hs108|chr5 (471 aa) initn: 3219 init1: 3219 opt: 3219 Z-score: 1621.9 bits: 309.4 E(32554): 5.1e-84 Smith-Waterman score: 3219; 100.0% identity (100.0% similar) in 471 aa overlap (1-471:1-471) 10 20 30 40 50 60 pF1KB5 MSYPQGYLYQAPGSLALYSCPAYGASALAAPRSEELARSASGSAFSPYPGSAAFTAQAAT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS38 MSYPQGYLYQAPGSLALYSCPAYGASALAAPRSEELARSASGSAFSPYPGSAAFTAQAAT 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB5 GFGSPLQYSADAAAAAAGFPSYMGAPYDAHTTGMTGAISYHPYGSAAYPYQLNDPAYRKN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS38 GFGSPLQYSADAAAAAAGFPSYMGAPYDAHTTGMTGAISYHPYGSAAYPYQLNDPAYRKN 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB5 ATRDATATLKAWLNEHRKNPYPTKGEKIMLAIITKMTLTQVSTWFANARRRLKKENKMTW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS38 ATRDATATLKAWLNEHRKNPYPTKGEKIMLAIITKMTLTQVSTWFANARRRLKKENKMTW 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB5 APRNKSEDEDEDEGDATRSKDESPDKAQEGTETSAEDEGISLHVDSLTDHSCSAESDGEK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS38 APRNKSEDEDEDEGDATRSKDESPDKAQEGTETSAEDEGISLHVDSLTDHSCSAESDGEK 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB5 LPCRAGDPLCESGSECKDKYDDLEDDEDDDEEGERGLAPPKPVTSSPLTGLEAPLLSPPP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS38 LPCRAGDPLCESGSECKDKYDDLEDDEDDDEEGERGLAPPKPVTSSPLTGLEAPLLSPPP 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB5 EAAPRGGRKTPQGSRTSPGAPPPASKPKLWSLAEIATSDLKQPSLGPGCGPPGLPAAAAP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS38 EAAPRGGRKTPQGSRTSPGAPPPASKPKLWSLAEIATSDLKQPSLGPGCGPPGLPAAAAP 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB5 ASTGAPPGGSPYPASPLLGRPLYYTSPFYGNYTNYGNLNAALQGQGLLRYNSAAAAPGEA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS38 ASTGAPPGGSPYPASPLLGRPLYYTSPFYGNYTNYGNLNAALQGQGLLRYNSAAAAPGEA 370 380 390 400 410 420 430 440 450 460 470 pF1KB5 LHTAPKAASDAGKAGAHPLESHYRSPGGGYEPKKDASEGCTVVGGGVQPYL ::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS38 LHTAPKAASDAGKAGAHPLESHYRSPGGGYEPKKDASEGCTVVGGGVQPYL 430 440 450 460 470 >>CCDS58462.1 IRX5 gene_id:10265|Hs108|chr16 (482 aa) initn: 932 init1: 655 opt: 1138 Z-score: 588.2 bits: 118.2 E(32554): 1.9e-26 Smith-Waterman score: 1247; 51.8% identity (69.8% similar) in 440 aa overlap (1-405:1-423) 10 20 30 40 50 60 pF1KB5 MSYPQGYLYQAPGSLALYSCPAYGASALAAPRSEELARSASGSAFSPYPGSAAFTAQAAT :::::::::: .::::::::::..:....::..::.::.:::::::: ::.:::: . CCDS58 MSYPQGYLYQPSASLALYSCPAYSTSVISGPRTDELGRSSSGSAFSPYAGSTAFTAPSP- 10 20 30 40 50 70 80 90 100 110 pF1KB5 GFGSPLQYSAD-AAAAAAGFPSYMGAPYDAHTTGMTGAISYHPYGSAAYPYQLNDPAYRK :..: :::.:: ::::::.: ::.:.::: :: ::.:...::::.. : .:::::: CCDS58 GYNSHLQYGADPAAAAAAAFSSYVGSPYD-HTPGMAGSLGYHPYAAPLGSYPYGDPAYRK 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB5 NATRDATATLKAWLNEHRKNPYPTKGEKIMLAIITKMTLTQVSTWFANARRRLKKENKMT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 NATRDATATLKAWLNEHRKNPYPTKGEKIMLAIITKMTLTQVSTWFANARRRLKKENKMT 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB5 WAPRNKSEDEDEDEGDATRSKDESPDKAQEGTETSAEDEGISLHVDSLTDHSCSAESDGE :.:::.::::.:.:. ...:: :. :. : ... :: ... . .: : CCDS58 WTPRNRSEDEEEEENIDLEKNDE--DEPQK-PEDKGDPEGPEAGAEQKAASGC------E 180 190 200 210 220 240 250 260 270 280 290 pF1KB5 KLPCRAGDPLCESGSECKDKYDDLEDDEDDDEEGERGL-APPKPVTSSPLTGLEAPLLSP .: : : .:.: . . .: . : .: .: .::. :: : : CCDS58 RLQ---GPPT-PAGKETEGSLSDSDFKEPPSEGRLDALQGPPRTGGPSPAGPAAARLAED 230 240 250 260 270 280 300 310 320 330 340 pF1KB5 P----PEAAPRGGR-----KTPQGS------RTSPGAPPPA--SKPKLWSLAEIATSDLK : : .:: : ..: : .. : :::: .:::::::::::::. : CCDS58 PAPHYPAGAPAPGPHPAAGEVPPGPGGPSVIHSPPPPPPPAVLAKPKLWSLAEIATSSDK 290 300 310 320 330 340 350 360 370 380 pF1KB5 QPSLGPG-----CGP-PGLP----------AAAAPASTGAPPGGSPYPASPLLGRPLYYT . : : : : :: : :. ::: . .: . :.:.. .:.:::::: CCDS58 VKDGGGGNEGSPCPPCPG-PIAGQALGGSRASPAPAPSRSPSAQCPFPGGTVLSRPLYYT 350 360 370 380 390 400 390 400 410 420 430 440 pF1KB5 SPFYGNYTNYGNLNAALQGQGLLRYNSAAAAPGEALHTAPKAASDAGKAGAHPLESHYRS .::: .:::::... :.:. CCDS58 APFYPGYTNYGSFGH-LHGHPGPGPGPTTGPGSHFNGLNQTVLNRADALAKDPKMLRSQS 410 420 430 440 450 460 >>CCDS10751.1 IRX5 gene_id:10265|Hs108|chr16 (483 aa) initn: 932 init1: 655 opt: 1134 Z-score: 586.2 bits: 117.8 E(32554): 2.5e-26 Smith-Waterman score: 1246; 51.8% identity (69.3% similar) in 440 aa overlap (1-405:1-424) 10 20 30 40 50 60 pF1KB5 MSYPQGYLYQAPGSLALYSCPAYGASALAAPRSEELARSASGSAFSPYPGSAAFTAQAAT :::::::::: .::::::::::..:....::..::.::.:::::::: ::.:::: . CCDS10 MSYPQGYLYQPSASLALYSCPAYSTSVISGPRTDELGRSSSGSAFSPYAGSTAFTAPSP- 10 20 30 40 50 70 80 90 100 110 pF1KB5 GFGSPLQYSAD-AAAAAAGFPSYMGAPYDAHTTGMTGAISYHPYGSAAYPYQLNDPAYRK :..: :::.:: ::::::.: ::.:.::: :: ::.:...::::.. : .:::::: CCDS10 GYNSHLQYGADPAAAAAAAFSSYVGSPYD-HTPGMAGSLGYHPYAAPLGSYPYGDPAYRK 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB5 NATRDATATLKAWLNEHRKNPYPTKGEKIMLAIITKMTLTQVSTWFANARRRLKKENKMT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 NATRDATATLKAWLNEHRKNPYPTKGEKIMLAIITKMTLTQVSTWFANARRRLKKENKMT 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB5 WAPRNKSEDEDEDEGDATRSKDESPDKAQEGTETSAEDEGISLHVDSLTDHSCSAESDGE :.:::.::::.:.:. ...:: :. :. ::.: : .. .::. . CCDS10 WTPRNRSEDEEEEENIDLEKNDE--DEPQK-----PEDKG-----DPEGPEAGGAEQKAA 180 190 200 210 220 240 250 260 270 280 290 pF1KB5 KLPCRAGDPLCESGSECKDKYDDLEDDEDDDEEGERGL-APPKPVTSSPLTGLEAPLLSP . : : .:.: . . .: . : .: .: .::. :: : : CCDS10 SGCERLQGPPTPAGKETEGSLSDSDFKEPPSEGRLDALQGPPRTGGPSPAGPAAARLAED 230 240 250 260 270 280 300 310 320 330 340 pF1KB5 P----PEAAPRGGR-----KTPQGS------RTSPGAPPPA--SKPKLWSLAEIATSDLK : : .:: : ..: : .. : :::: .:::::::::::::. : CCDS10 PAPHYPAGAPAPGPHPAAGEVPPGPGGPSVIHSPPPPPPPAVLAKPKLWSLAEIATSSDK 290 300 310 320 330 340 350 360 370 380 pF1KB5 QPSLGPG-----CGP-PGLP----------AAAAPASTGAPPGGSPYPASPLLGRPLYYT . : : : : :: : :. ::: . .: . :.:.. .:.:::::: CCDS10 VKDGGGGNEGSPCPPCPG-PIAGQALGGSRASPAPAPSRSPSAQCPFPGGTVLSRPLYYT 350 360 370 380 390 400 390 400 410 420 430 440 pF1KB5 SPFYGNYTNYGNLNAALQGQGLLRYNSAAAAPGEALHTAPKAASDAGKAGAHPLESHYRS .::: .:::::... :.:. CCDS10 APFYPGYTNYGSFGH-LHGHPGPGPGPTTGPGSHFNGLNQTVLNRADALAKDPKMLRSQS 410 420 430 440 450 460 >>CCDS10750.1 IRX3 gene_id:79191|Hs108|chr16 (501 aa) initn: 650 init1: 513 opt: 729 Z-score: 384.9 bits: 80.6 E(32554): 4.1e-15 Smith-Waterman score: 780; 37.9% identity (59.5% similar) in 496 aa overlap (1-452:1-480) 10 20 30 40 pF1KB5 MSYPQ-GYLY-------QAPGSLALYSCPAYGASALAAPRSEELARSASGSAFSPY---P ::.:: :: : . ::. . . : . ..:.: :: : .. ....: : CCDS10 MSFPQLGYQYIRPLYPSERPGAAGGSGGSAGARGGLGAGASELNASGSLSNVLSSVYGAP 10 20 30 40 50 60 50 60 70 80 90 100 pF1KB5 GSAAFTAQAATGFGSPLQYSADAAAAAAGFPSYMGAPYDAHTT-GM---TGAISY-HPYG .:: .: :: :.:. : :.:. ::. .:: :. . . :. ..: .. ::. CCDS10 YAAAAAAAAAQGYGAFLPYAAELPI----FPQ-LGAQYELKDSPGVQHPAAAAAFPHPH- 70 80 90 100 110 110 120 130 140 150 160 pF1KB5 SAAYPY---QLNDPAYRKNATRDATATLKAWLNEHRKNPYPTKGEKIMLAIITKMTLTQV : ::: :..::. :::::..:.:::::::::::::::::::::::::::::::::: CCDS10 PAFYPYGQYQFGDPSRPKNATRESTSTLKAWLNEHRKNPYPTKGEKIMLAIITKMTLTQV 120 130 140 150 160 170 170 180 190 200 210 220 pF1KB5 STWFANARRRLKKENKMTWAPRNKSEDEDEDEGDATRSKDESPDKAQEGTETSAEDEGIS ::::::::::::::::::::::.....: . :. . .:: :. . : :.: .. CCDS10 STWFANARRRLKKENKMTWAPRSRTDEEGNAYGSEREEEDEEEDEEDGKRELELEEEELG 180 190 200 210 220 230 230 240 250 260 270 pF1KB5 LHVDS-----LTDHSCSAESDGEKLPCRAGDP-LCESGSECKDK---YDDLEDDEDDD-E . .. :.: . . : : :.: : .: : .:. .: . :....: : CCDS10 GEEEDTGGEGLADDDEDEEIDLENLDGAATEPELSLAGAARRDGDLGLGPISDSKNSDSE 240 250 260 270 280 290 280 290 300 310 320 pF1KB5 EGERGLAPPKPVTSSPLTGLEAPLLSPPPEAAPRGGRKTPQGSRTSPGAPPPA-----SK .. .:: .:. :. .: :: .::: :. . .: : .: :: :: .: CCDS10 DSSEGLED-RPL---PVLSL-AP--APPPVAVASPSLPSPPVS-LDPCAPAPAPASALQK 300 310 320 330 340 330 340 350 360 370 380 pF1KB5 PKLWSLAEIATSDLKQPSLGPGCG--PPGLPAAAAPASTGAPPGGSPYPASPLLGRPL-- ::.::::: ::: . :: : ::: ::.::.. :... : :.. :: CCDS10 PKIWSLAETATSPDNPRRSPPGAGGSPPG--AAVAPSALQLSPAAAAAAAHRLVSAPLGK 350 360 370 380 390 400 390 400 410 420 430 pF1KB5 ---YYTSPFYGNYTNYGNLNAALQGQG---LLRYNSAAAAPGEALHTAPKAASDAGKAGA . . :: : . .: :.. :: .::. :. : : : ..: CCDS10 FPAWTNRPFPGPPPGPRLHPLSLLGSAPPHLLGLPGAAGHPAAAAAFARPAEPEGGTDRC 410 420 430 440 450 460 440 450 460 470 pF1KB5 HPLESHYRSPGGGYEPKKDASEGCTVVGGGVQPYL :: . . ...: CCDS10 SALEVEKKLLKTAFQPVPRRPQNHLDAALVLSALSSS 470 480 490 500 >>CCDS34132.1 IRX1 gene_id:79192|Hs108|chr5 (480 aa) initn: 551 init1: 448 opt: 607 Z-score: 324.5 bits: 69.4 E(32554): 9.4e-12 Smith-Waterman score: 692; 37.6% identity (60.0% similar) in 447 aa overlap (4-422:17-402) 10 20 30 40 pF1KB5 MSYPQGYLYQAPGSLALYSCPAYGASALAAPRSEELARSASGSAFSP : .: . :: :: . : .::. . : . ::. .:...: . CCDS34 MSFPQLGYPQYLSAAGPGAYGGERPGVLAAAAAAAAAASS-GRPGAAELGGGAGAAAVTS 10 20 30 40 50 50 60 70 80 90 pF1KB5 YPG--SAAFTAQAATGFGSPLQYSADAAAAAAGFPSYMGAPYD------AH--TTGMTGA : .:: .: .... : :.:: . . : ::. :. .: : . : CCDS34 VLGMYAAAGPYAGAPNYSAFLPYAADLS-----LFSQMGSQYELKDNPGVHPATFAAHTA 60 70 80 90 100 110 100 110 120 130 140 150 pF1KB5 ISYHPYGSAAYPYQLNDPAYRKNATRDATATLKAWLNEHRKNPYPTKGEKIMLAIITKMT .:.:::. .: .::. :::::..:.:::::::::::::::::::::::::::::: CCDS34 PAYYPYGQ----FQYGDPGRPKNATRESTSTLKAWLNEHRKNPYPTKGEKIMLAIITKMT 120 130 140 150 160 170 160 170 180 190 200 210 pF1KB5 LTQVSTWFANARRRLKKENKMTWAPRNKSEDEDEDEGDATRSKDESPDKAQEGTETSAED ::::::::::::::::::::.::. :.:.... :. :.. .:.::.. : . : CCDS34 LTQVSTWFANARRRLKKENKVTWGARSKDQEDGALFGSDTEG---DPEKAEDDEEIDLE- 180 190 200 210 220 220 230 240 250 260 270 pF1KB5 EGISLHVDSLTDHSCSAESDGEKLPCRAGDPLCESGSECKDKYDDLEDDEDDDEEGERGL :. .:.. .: ::.. ..:::....: CCDS34 ---SIDIDKIDEH------DGDQ------------------------SNEDDEDKAEAPH 230 240 250 280 290 300 310 320 pF1KB5 APPKPVT-----SSPLTGLEAPLLSPPPEAAPRG-GRKTPQGSRT---SPGAPP------ :: : . .:::.. : .:. :. .: : ....:. . : :::: CCDS34 APAAPSALARDQGSPLAA--ADVLK--PQDSPLGLAKEAPEPGSTRLLSPGAAAGGLQGA 260 270 280 290 300 330 340 350 360 370 380 pF1KB5 PASKPKLWSLAEIATSDLKQPSLGPGCGPPGLPAAAAPASTGAPPGGSPYPASPLLGRPL : .:::.::::: ::: :. .: .:: : :. :.. : : .:.: .: CCDS34 PHGKPKIWSLAETATS----PDGAPKASPP--PPAGHPGAHG-PSAGAPLQHPAFLPSHG 310 320 330 340 350 360 390 400 410 420 430 pF1KB5 YYTSPFYGNYTNYGNLNAALQGQG-LLRYNS--AAAAPGEALHTAPKAASDAGKAGAHPL :: . :...:. :.:. .:: :: . : ...:: : : CCDS34 LYTCHI-GKFSNW--TNSAFLAQGSLLNMRSFLGVGAPHAAPHGPHLPAPPPPQPPVAIA 370 380 390 400 410 440 450 460 470 pF1KB5 ESHYRSPGGGYEPKKDASEGCTVVGGGVQPYL CCDS34 PGALNGDKASVRSSPTLPERDLVPRPDSPAQQLKSPFQPVRDNSLAPQEGTPRILAALPS 420 430 440 450 460 470 471 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Wed Nov 2 22:26:58 2016 done: Wed Nov 2 22:26:58 2016 Total Scan time: 3.510 Total Display time: 0.020 Function used was FASTA [36.3.4 Apr, 2011]