FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB5805, 471 aa
1>>>pF1KB5805 471 - 471 aa - 471 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 10.8771+/- 0.001; mu= -2.9985+/- 0.061
mean_var=405.3882+/-82.370, 0's: 0 Z-trim(116.8): 14 B-trim: 0 in 0/52
Lambda= 0.063700
statistics sampled from 17408 (17420) to 17408 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.81), E-opt: 0.2 (0.535), width: 16
Scan time: 3.510
The best scores are: opt bits E(32554)
CCDS3868.1 IRX2 gene_id:153572|Hs108|chr5 ( 471) 3219 309.4 5.1e-84
CCDS58462.1 IRX5 gene_id:10265|Hs108|chr16 ( 482) 1138 118.2 1.9e-26
CCDS10751.1 IRX5 gene_id:10265|Hs108|chr16 ( 483) 1134 117.8 2.5e-26
CCDS10750.1 IRX3 gene_id:79191|Hs108|chr16 ( 501) 729 80.6 4.1e-15
CCDS34132.1 IRX1 gene_id:79192|Hs108|chr5 ( 480) 607 69.4 9.4e-12
>>CCDS3868.1 IRX2 gene_id:153572|Hs108|chr5 (471 aa)
initn: 3219 init1: 3219 opt: 3219 Z-score: 1621.9 bits: 309.4 E(32554): 5.1e-84
Smith-Waterman score: 3219; 100.0% identity (100.0% similar) in 471 aa overlap (1-471:1-471)
10 20 30 40 50 60
pF1KB5 MSYPQGYLYQAPGSLALYSCPAYGASALAAPRSEELARSASGSAFSPYPGSAAFTAQAAT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS38 MSYPQGYLYQAPGSLALYSCPAYGASALAAPRSEELARSASGSAFSPYPGSAAFTAQAAT
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB5 GFGSPLQYSADAAAAAAGFPSYMGAPYDAHTTGMTGAISYHPYGSAAYPYQLNDPAYRKN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS38 GFGSPLQYSADAAAAAAGFPSYMGAPYDAHTTGMTGAISYHPYGSAAYPYQLNDPAYRKN
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB5 ATRDATATLKAWLNEHRKNPYPTKGEKIMLAIITKMTLTQVSTWFANARRRLKKENKMTW
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS38 ATRDATATLKAWLNEHRKNPYPTKGEKIMLAIITKMTLTQVSTWFANARRRLKKENKMTW
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB5 APRNKSEDEDEDEGDATRSKDESPDKAQEGTETSAEDEGISLHVDSLTDHSCSAESDGEK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS38 APRNKSEDEDEDEGDATRSKDESPDKAQEGTETSAEDEGISLHVDSLTDHSCSAESDGEK
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB5 LPCRAGDPLCESGSECKDKYDDLEDDEDDDEEGERGLAPPKPVTSSPLTGLEAPLLSPPP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS38 LPCRAGDPLCESGSECKDKYDDLEDDEDDDEEGERGLAPPKPVTSSPLTGLEAPLLSPPP
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB5 EAAPRGGRKTPQGSRTSPGAPPPASKPKLWSLAEIATSDLKQPSLGPGCGPPGLPAAAAP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS38 EAAPRGGRKTPQGSRTSPGAPPPASKPKLWSLAEIATSDLKQPSLGPGCGPPGLPAAAAP
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB5 ASTGAPPGGSPYPASPLLGRPLYYTSPFYGNYTNYGNLNAALQGQGLLRYNSAAAAPGEA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS38 ASTGAPPGGSPYPASPLLGRPLYYTSPFYGNYTNYGNLNAALQGQGLLRYNSAAAAPGEA
370 380 390 400 410 420
430 440 450 460 470
pF1KB5 LHTAPKAASDAGKAGAHPLESHYRSPGGGYEPKKDASEGCTVVGGGVQPYL
:::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS38 LHTAPKAASDAGKAGAHPLESHYRSPGGGYEPKKDASEGCTVVGGGVQPYL
430 440 450 460 470
>>CCDS58462.1 IRX5 gene_id:10265|Hs108|chr16 (482 aa)
initn: 932 init1: 655 opt: 1138 Z-score: 588.2 bits: 118.2 E(32554): 1.9e-26
Smith-Waterman score: 1247; 51.8% identity (69.8% similar) in 440 aa overlap (1-405:1-423)
10 20 30 40 50 60
pF1KB5 MSYPQGYLYQAPGSLALYSCPAYGASALAAPRSEELARSASGSAFSPYPGSAAFTAQAAT
:::::::::: .::::::::::..:....::..::.::.:::::::: ::.:::: .
CCDS58 MSYPQGYLYQPSASLALYSCPAYSTSVISGPRTDELGRSSSGSAFSPYAGSTAFTAPSP-
10 20 30 40 50
70 80 90 100 110
pF1KB5 GFGSPLQYSAD-AAAAAAGFPSYMGAPYDAHTTGMTGAISYHPYGSAAYPYQLNDPAYRK
:..: :::.:: ::::::.: ::.:.::: :: ::.:...::::.. : .::::::
CCDS58 GYNSHLQYGADPAAAAAAAFSSYVGSPYD-HTPGMAGSLGYHPYAAPLGSYPYGDPAYRK
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB5 NATRDATATLKAWLNEHRKNPYPTKGEKIMLAIITKMTLTQVSTWFANARRRLKKENKMT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 NATRDATATLKAWLNEHRKNPYPTKGEKIMLAIITKMTLTQVSTWFANARRRLKKENKMT
120 130 140 150 160 170
180 190 200 210 220 230
pF1KB5 WAPRNKSEDEDEDEGDATRSKDESPDKAQEGTETSAEDEGISLHVDSLTDHSCSAESDGE
:.:::.::::.:.:. ...:: :. :. : ... :: ... . .: :
CCDS58 WTPRNRSEDEEEEENIDLEKNDE--DEPQK-PEDKGDPEGPEAGAEQKAASGC------E
180 190 200 210 220
240 250 260 270 280 290
pF1KB5 KLPCRAGDPLCESGSECKDKYDDLEDDEDDDEEGERGL-APPKPVTSSPLTGLEAPLLSP
.: : : .:.: . . .: . : .: .: .::. :: : :
CCDS58 RLQ---GPPT-PAGKETEGSLSDSDFKEPPSEGRLDALQGPPRTGGPSPAGPAAARLAED
230 240 250 260 270 280
300 310 320 330 340
pF1KB5 P----PEAAPRGGR-----KTPQGS------RTSPGAPPPA--SKPKLWSLAEIATSDLK
: : .:: : ..: : .. : :::: .:::::::::::::. :
CCDS58 PAPHYPAGAPAPGPHPAAGEVPPGPGGPSVIHSPPPPPPPAVLAKPKLWSLAEIATSSDK
290 300 310 320 330 340
350 360 370 380
pF1KB5 QPSLGPG-----CGP-PGLP----------AAAAPASTGAPPGGSPYPASPLLGRPLYYT
. : : : : :: : :. ::: . .: . :.:.. .:.::::::
CCDS58 VKDGGGGNEGSPCPPCPG-PIAGQALGGSRASPAPAPSRSPSAQCPFPGGTVLSRPLYYT
350 360 370 380 390 400
390 400 410 420 430 440
pF1KB5 SPFYGNYTNYGNLNAALQGQGLLRYNSAAAAPGEALHTAPKAASDAGKAGAHPLESHYRS
.::: .:::::... :.:.
CCDS58 APFYPGYTNYGSFGH-LHGHPGPGPGPTTGPGSHFNGLNQTVLNRADALAKDPKMLRSQS
410 420 430 440 450 460
>>CCDS10751.1 IRX5 gene_id:10265|Hs108|chr16 (483 aa)
initn: 932 init1: 655 opt: 1134 Z-score: 586.2 bits: 117.8 E(32554): 2.5e-26
Smith-Waterman score: 1246; 51.8% identity (69.3% similar) in 440 aa overlap (1-405:1-424)
10 20 30 40 50 60
pF1KB5 MSYPQGYLYQAPGSLALYSCPAYGASALAAPRSEELARSASGSAFSPYPGSAAFTAQAAT
:::::::::: .::::::::::..:....::..::.::.:::::::: ::.:::: .
CCDS10 MSYPQGYLYQPSASLALYSCPAYSTSVISGPRTDELGRSSSGSAFSPYAGSTAFTAPSP-
10 20 30 40 50
70 80 90 100 110
pF1KB5 GFGSPLQYSAD-AAAAAAGFPSYMGAPYDAHTTGMTGAISYHPYGSAAYPYQLNDPAYRK
:..: :::.:: ::::::.: ::.:.::: :: ::.:...::::.. : .::::::
CCDS10 GYNSHLQYGADPAAAAAAAFSSYVGSPYD-HTPGMAGSLGYHPYAAPLGSYPYGDPAYRK
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB5 NATRDATATLKAWLNEHRKNPYPTKGEKIMLAIITKMTLTQVSTWFANARRRLKKENKMT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS10 NATRDATATLKAWLNEHRKNPYPTKGEKIMLAIITKMTLTQVSTWFANARRRLKKENKMT
120 130 140 150 160 170
180 190 200 210 220 230
pF1KB5 WAPRNKSEDEDEDEGDATRSKDESPDKAQEGTETSAEDEGISLHVDSLTDHSCSAESDGE
:.:::.::::.:.:. ...:: :. :. ::.: : .. .::. .
CCDS10 WTPRNRSEDEEEEENIDLEKNDE--DEPQK-----PEDKG-----DPEGPEAGGAEQKAA
180 190 200 210 220
240 250 260 270 280 290
pF1KB5 KLPCRAGDPLCESGSECKDKYDDLEDDEDDDEEGERGL-APPKPVTSSPLTGLEAPLLSP
. : : .:.: . . .: . : .: .: .::. :: : :
CCDS10 SGCERLQGPPTPAGKETEGSLSDSDFKEPPSEGRLDALQGPPRTGGPSPAGPAAARLAED
230 240 250 260 270 280
300 310 320 330 340
pF1KB5 P----PEAAPRGGR-----KTPQGS------RTSPGAPPPA--SKPKLWSLAEIATSDLK
: : .:: : ..: : .. : :::: .:::::::::::::. :
CCDS10 PAPHYPAGAPAPGPHPAAGEVPPGPGGPSVIHSPPPPPPPAVLAKPKLWSLAEIATSSDK
290 300 310 320 330 340
350 360 370 380
pF1KB5 QPSLGPG-----CGP-PGLP----------AAAAPASTGAPPGGSPYPASPLLGRPLYYT
. : : : : :: : :. ::: . .: . :.:.. .:.::::::
CCDS10 VKDGGGGNEGSPCPPCPG-PIAGQALGGSRASPAPAPSRSPSAQCPFPGGTVLSRPLYYT
350 360 370 380 390 400
390 400 410 420 430 440
pF1KB5 SPFYGNYTNYGNLNAALQGQGLLRYNSAAAAPGEALHTAPKAASDAGKAGAHPLESHYRS
.::: .:::::... :.:.
CCDS10 APFYPGYTNYGSFGH-LHGHPGPGPGPTTGPGSHFNGLNQTVLNRADALAKDPKMLRSQS
410 420 430 440 450 460
>>CCDS10750.1 IRX3 gene_id:79191|Hs108|chr16 (501 aa)
initn: 650 init1: 513 opt: 729 Z-score: 384.9 bits: 80.6 E(32554): 4.1e-15
Smith-Waterman score: 780; 37.9% identity (59.5% similar) in 496 aa overlap (1-452:1-480)
10 20 30 40
pF1KB5 MSYPQ-GYLY-------QAPGSLALYSCPAYGASALAAPRSEELARSASGSAFSPY---P
::.:: :: : . ::. . . : . ..:.: :: : .. ....: :
CCDS10 MSFPQLGYQYIRPLYPSERPGAAGGSGGSAGARGGLGAGASELNASGSLSNVLSSVYGAP
10 20 30 40 50 60
50 60 70 80 90 100
pF1KB5 GSAAFTAQAATGFGSPLQYSADAAAAAAGFPSYMGAPYDAHTT-GM---TGAISY-HPYG
.:: .: :: :.:. : :.:. ::. .:: :. . . :. ..: .. ::.
CCDS10 YAAAAAAAAAQGYGAFLPYAAELPI----FPQ-LGAQYELKDSPGVQHPAAAAAFPHPH-
70 80 90 100 110
110 120 130 140 150 160
pF1KB5 SAAYPY---QLNDPAYRKNATRDATATLKAWLNEHRKNPYPTKGEKIMLAIITKMTLTQV
: ::: :..::. :::::..:.::::::::::::::::::::::::::::::::::
CCDS10 PAFYPYGQYQFGDPSRPKNATRESTSTLKAWLNEHRKNPYPTKGEKIMLAIITKMTLTQV
120 130 140 150 160 170
170 180 190 200 210 220
pF1KB5 STWFANARRRLKKENKMTWAPRNKSEDEDEDEGDATRSKDESPDKAQEGTETSAEDEGIS
::::::::::::::::::::::.....: . :. . .:: :. . : :.: ..
CCDS10 STWFANARRRLKKENKMTWAPRSRTDEEGNAYGSEREEEDEEEDEEDGKRELELEEEELG
180 190 200 210 220 230
230 240 250 260 270
pF1KB5 LHVDS-----LTDHSCSAESDGEKLPCRAGDP-LCESGSECKDK---YDDLEDDEDDD-E
. .. :.: . . : : :.: : .: : .:. .: . :....: :
CCDS10 GEEEDTGGEGLADDDEDEEIDLENLDGAATEPELSLAGAARRDGDLGLGPISDSKNSDSE
240 250 260 270 280 290
280 290 300 310 320
pF1KB5 EGERGLAPPKPVTSSPLTGLEAPLLSPPPEAAPRGGRKTPQGSRTSPGAPPPA-----SK
.. .:: .:. :. .: :: .::: :. . .: : .: :: :: .:
CCDS10 DSSEGLED-RPL---PVLSL-AP--APPPVAVASPSLPSPPVS-LDPCAPAPAPASALQK
300 310 320 330 340
330 340 350 360 370 380
pF1KB5 PKLWSLAEIATSDLKQPSLGPGCG--PPGLPAAAAPASTGAPPGGSPYPASPLLGRPL--
::.::::: ::: . :: : ::: ::.::.. :... : :.. ::
CCDS10 PKIWSLAETATSPDNPRRSPPGAGGSPPG--AAVAPSALQLSPAAAAAAAHRLVSAPLGK
350 360 370 380 390 400
390 400 410 420 430
pF1KB5 ---YYTSPFYGNYTNYGNLNAALQGQG---LLRYNSAAAAPGEALHTAPKAASDAGKAGA
. . :: : . .: :.. :: .::. :. : : : ..:
CCDS10 FPAWTNRPFPGPPPGPRLHPLSLLGSAPPHLLGLPGAAGHPAAAAAFARPAEPEGGTDRC
410 420 430 440 450 460
440 450 460 470
pF1KB5 HPLESHYRSPGGGYEPKKDASEGCTVVGGGVQPYL
:: . . ...:
CCDS10 SALEVEKKLLKTAFQPVPRRPQNHLDAALVLSALSSS
470 480 490 500
>>CCDS34132.1 IRX1 gene_id:79192|Hs108|chr5 (480 aa)
initn: 551 init1: 448 opt: 607 Z-score: 324.5 bits: 69.4 E(32554): 9.4e-12
Smith-Waterman score: 692; 37.6% identity (60.0% similar) in 447 aa overlap (4-422:17-402)
10 20 30 40
pF1KB5 MSYPQGYLYQAPGSLALYSCPAYGASALAAPRSEELARSASGSAFSP
: .: . :: :: . : .::. . : . ::. .:...: .
CCDS34 MSFPQLGYPQYLSAAGPGAYGGERPGVLAAAAAAAAAASS-GRPGAAELGGGAGAAAVTS
10 20 30 40 50
50 60 70 80 90
pF1KB5 YPG--SAAFTAQAATGFGSPLQYSADAAAAAAGFPSYMGAPYD------AH--TTGMTGA
: .:: .: .... : :.:: . . : ::. :. .: : . :
CCDS34 VLGMYAAAGPYAGAPNYSAFLPYAADLS-----LFSQMGSQYELKDNPGVHPATFAAHTA
60 70 80 90 100 110
100 110 120 130 140 150
pF1KB5 ISYHPYGSAAYPYQLNDPAYRKNATRDATATLKAWLNEHRKNPYPTKGEKIMLAIITKMT
.:.:::. .: .::. :::::..:.::::::::::::::::::::::::::::::
CCDS34 PAYYPYGQ----FQYGDPGRPKNATRESTSTLKAWLNEHRKNPYPTKGEKIMLAIITKMT
120 130 140 150 160 170
160 170 180 190 200 210
pF1KB5 LTQVSTWFANARRRLKKENKMTWAPRNKSEDEDEDEGDATRSKDESPDKAQEGTETSAED
::::::::::::::::::::.::. :.:.... :. :.. .:.::.. : . :
CCDS34 LTQVSTWFANARRRLKKENKVTWGARSKDQEDGALFGSDTEG---DPEKAEDDEEIDLE-
180 190 200 210 220
220 230 240 250 260 270
pF1KB5 EGISLHVDSLTDHSCSAESDGEKLPCRAGDPLCESGSECKDKYDDLEDDEDDDEEGERGL
:. .:.. .: ::.. ..:::....:
CCDS34 ---SIDIDKIDEH------DGDQ------------------------SNEDDEDKAEAPH
230 240 250
280 290 300 310 320
pF1KB5 APPKPVT-----SSPLTGLEAPLLSPPPEAAPRG-GRKTPQGSRT---SPGAPP------
:: : . .:::.. : .:. :. .: : ....:. . : ::::
CCDS34 APAAPSALARDQGSPLAA--ADVLK--PQDSPLGLAKEAPEPGSTRLLSPGAAAGGLQGA
260 270 280 290 300
330 340 350 360 370 380
pF1KB5 PASKPKLWSLAEIATSDLKQPSLGPGCGPPGLPAAAAPASTGAPPGGSPYPASPLLGRPL
: .:::.::::: ::: :. .: .:: : :. :.. : : .:.: .:
CCDS34 PHGKPKIWSLAETATS----PDGAPKASPP--PPAGHPGAHG-PSAGAPLQHPAFLPSHG
310 320 330 340 350 360
390 400 410 420 430
pF1KB5 YYTSPFYGNYTNYGNLNAALQGQG-LLRYNS--AAAAPGEALHTAPKAASDAGKAGAHPL
:: . :...:. :.:. .:: :: . : ...:: : :
CCDS34 LYTCHI-GKFSNW--TNSAFLAQGSLLNMRSFLGVGAPHAAPHGPHLPAPPPPQPPVAIA
370 380 390 400 410
440 450 460 470
pF1KB5 ESHYRSPGGGYEPKKDASEGCTVVGGGVQPYL
CCDS34 PGALNGDKASVRSSPTLPERDLVPRPDSPAQQLKSPFQPVRDNSLAPQEGTPRILAALPS
420 430 440 450 460 470
471 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Wed Nov 2 22:26:58 2016 done: Wed Nov 2 22:26:58 2016
Total Scan time: 3.510 Total Display time: 0.020
Function used was FASTA [36.3.4 Apr, 2011]