FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KSDA0048, 606 aa
1>>>pF1KSDA0048 606 - 606 aa - 606 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 12.1279+/-0.00113; mu= -12.0590+/- 0.067
mean_var=405.9031+/-86.521, 0's: 0 Z-trim(114.4): 709 B-trim: 0 in 0/52
Lambda= 0.063659
statistics sampled from 14170 (14982) to 14170 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.752), E-opt: 0.2 (0.46), width: 16
Scan time: 3.730
The best scores are: opt bits E(32554)
CCDS11521.2 SP2 gene_id:6668|Hs108|chr17 ( 613) 3975 379.5 7e-105
CCDS44898.1 SP1 gene_id:6667|Hs108|chr12 ( 778) 844 92.0 3.1e-18
CCDS8857.1 SP1 gene_id:6667|Hs108|chr12 ( 785) 844 92.0 3.1e-18
CCDS5373.1 SP4 gene_id:6671|Hs108|chr7 ( 784) 780 86.1 1.8e-16
CCDS46452.1 SP3 gene_id:6670|Hs108|chr2 ( 713) 756 83.9 7.8e-16
CCDS2254.1 SP3 gene_id:6670|Hs108|chr2 ( 781) 756 83.9 8.4e-16
CCDS33322.1 SP5 gene_id:389058|Hs108|chr2 ( 398) 569 66.5 7.4e-11
>>CCDS11521.2 SP2 gene_id:6668|Hs108|chr17 (613 aa)
initn: 3975 init1: 3975 opt: 3975 Z-score: 1996.4 bits: 379.5 E(32554): 7e-105
Smith-Waterman score: 3975; 100.0% identity (100.0% similar) in 606 aa overlap (1-606:8-613)
10 20 30 40 50
pF1KSD MAATAAVSPSDYLQPAASTTQDSQPSPLALLAATCSKIGPPAVEAAVTPPAPP
:::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 MSDPQTSMAATAAVSPSDYLQPAASTTQDSQPSPLALLAATCSKIGPPAVEAAVTPPAPP
10 20 30 40 50 60
60 70 80 90 100 110
pF1KSD QPTPRKLVPIKPAPLPLSPGKNSFGILSSKGNILQIQGSQLSASYPGGQLVFAIQNPTMI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 QPTPRKLVPIKPAPLPLSPGKNSFGILSSKGNILQIQGSQLSASYPGGQLVFAIQNPTMI
70 80 90 100 110 120
120 130 140 150 160 170
pF1KSD NKGTRSNANIQYQAVPQIQASNSQTIQVQPNLTNQIQIIPGTNQAIITPSPSSHKPVPIK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 NKGTRSNANIQYQAVPQIQASNSQTIQVQPNLTNQIQIIPGTNQAIITPSPSSHKPVPIK
130 140 150 160 170 180
180 190 200 210 220 230
pF1KSD PAPIQKSSTTTTPVQSGANVVKLTGGGGNVTLTLPVNNLVNASDTGAPTQLLTESPPTPL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 PAPIQKSSTTTTPVQSGANVVKLTGGGGNVTLTLPVNNLVNASDTGAPTQLLTESPPTPL
190 200 210 220 230 240
240 250 260 270 280 290
pF1KSD SKTNKKARKKSLPASQPPVAVAEQVETVLIETTADNIIQAGNNLLIVQSPGGGQPAVVQQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 SKTNKKARKKSLPASQPPVAVAEQVETVLIETTADNIIQAGNNLLIVQSPGGGQPAVVQQ
250 260 270 280 290 300
300 310 320 330 340 350
pF1KSD VQVVPPKAEQQQVVQIPQQALRVVQAASATLPTVPQKPSQNFQIQAAEPTPTQVYIRTPS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 VQVVPPKAEQQQVVQIPQQALRVVQAASATLPTVPQKPSQNFQIQAAEPTPTQVYIRTPS
310 320 330 340 350 360
360 370 380 390 400 410
pF1KSD GEVQTVLVQDSPPATAAATSNTTCSSPASRAPHLSGTSKKHSAAILRKERPLPKIAPAGS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 GEVQTVLVQDSPPATAAATSNTTCSSPASRAPHLSGTSKKHSAAILRKERPLPKIAPAGS
370 380 390 400 410 420
420 430 440 450 460 470
pF1KSD IISLNAAQLAAAAQAMQTININGVQVQGVPVTITNTGGQQQLTVQNVSGNNLTISGLSPT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 IISLNAAQLAAAAQAMQTININGVQVQGVPVTITNTGGQQQLTVQNVSGNNLTISGLSPT
430 440 450 460 470 480
480 490 500 510 520 530
pF1KSD QIQLQMEQALAGETQPGEKRRRMACTCPNCKDGEKRSGEQGKKKHVCHIPDCGKTFRKTS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 QIQLQMEQALAGETQPGEKRRRMACTCPNCKDGEKRSGEQGKKKHVCHIPDCGKTFRKTS
490 500 510 520 530 540
540 550 560 570 580 590
pF1KSD LLRAHVRLHTGERPFVCNWFFCGKRFTRSDELQRHARTHTGDKRFECAQCQKRFMRSDHL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 LLRAHVRLHTGERPFVCNWFFCGKRFTRSDELQRHARTHTGDKRFECAQCQKRFMRSDHL
550 560 570 580 590 600
600
pF1KSD TKHYKTHLVTKNL
:::::::::::::
CCDS11 TKHYKTHLVTKNL
610
>>CCDS44898.1 SP1 gene_id:6667|Hs108|chr12 (778 aa)
initn: 758 init1: 493 opt: 844 Z-score: 440.9 bits: 92.0 E(32554): 3.1e-18
Smith-Waterman score: 933; 35.4% identity (58.2% similar) in 632 aa overlap (70-600:93-701)
40 50 60 70 80 90
pF1KSD PPAVEAAVTPPAPPQPTPRKLVPIKPAPLPLSPGKNSFGILSSKGNIL----QIQGSQLS
:: : :.. :.::... . .::. .
CCDS44 RIESPNENSNNSQGPSQSGGTGELDLTATQLSQGANGWQIISSSSGATPTSKEQSGSSTN
70 80 90 100 110 120
100 110 120 130 140
pF1KSD AS----------YPGGQLVFA----IQNPTMINKGTRSNANIQYQAVPQIQASNSQTIQ-
.: ::: : : .:: ... :::::..::.:. ..: .:
CCDS44 GSNGSESSKNRTVSGGQYVVAAAPNLQNQQVLTGLPGVMPNIQYQVIPQFQTVDGQQLQF
130 140 150 160 170 180
150 160 170 180 190
pF1KSD ------VQPNLTNQIQIIPGTNQAIITPSPSSHKPVPIKPAPIQKSSTTTTPVQSGANVV
:: . ..:::::::.:: ::: :. . . : .:.. .:.:. :: :
CCDS44 AATGAQVQQDGSGQIQIIPGANQQIITNRGSGGNIIAAMPNLLQQA----VPLQGLANNV
190 200 210 220 230
200 210 220 230
pF1KSD KLTGG-----------GGNVTLTLPVNNLVNASDTGAPTQLLT-------ESPPTPLSKT
:.: .::.:: ::::. :.:. .: .: :: :.. .
CCDS44 -LSGQTQYVTNVPVALNGNITL-LPVNS-VSAATLTPSSQAVTISSSGSQESGSQPVT-S
240 250 260 270 280 290
240 250 260 270
pF1KSD NKKARKKSLPASQPPVA-VAEQVETVLIETTADNI-------------------------
. . :: .:: . .... ::..:.
CCDS44 GTTISSASLVSSQASSSSFFTNANSYSTTTTTSNMGIMNFTTSGSSGTNSQGQTPQRVSG
300 310 320 330 340 350
280 290 300 310 320
pF1KSD IQAGNNLLIVQ--SPGGGQPAVVQQVQVVPPKAEQQQVVQIPQ-----QALRVVQAA---
.:... : : : . ::. : :. ...:::.. :: :::...:::
CCDS44 LQGSDALNIQQNQTSGGSLQAGQQKEGEQNQQTQQQQILIQPQLVQGGQALQALQAAPLS
360 370 380 390 400 410
330 340 350 360 370
pF1KSD --SATLPTVPQKPSQNFQIQAAEPTPTQVYIRTPS----GEV--QTVLVQDSPPATAAAT
. : .. :. ::.:.::. :. . ::::. :.: ::. .:. . :
CCDS44 GQTFTTQAISQETLQNLQLQAV-PNSGPIIIRTPTVGPNGQVSWQTLQLQNLQVQNPQAQ
420 430 440 450 460 470
380 390 400 410 420 430
pF1KSD SNTTCSSPASRAPHLSGTSKKHSAAILRKERPLPKIA--PAGSIISLNAAQLAAAAQAMQ
. : :: ..:.: .... :. . : :::.. ..:::::.. ..:
CCDS44 TITL-------AP-MQGVSLGQTSSSNTTLTPIASAASIPAGTV-TVNAAQLSSMP-GLQ
480 490 500 510 520
440 450 460 470 480
pF1KSD TININ-----GVQV---QGVPVTITNTGGQQ--QLTVQNVSGNNLTISGLSPTQIQLQME
:::.. :.:: ::.:..:.:. :.. :: .....:... . : . :
CCDS44 TINLSALGTSGIQVHPIQGLPLAIANAPGDHGAQLGLHGAGGDGIH----DDTAGGEEGE
530 540 550 560 570
490 500 510 520 530
pF1KSD QALAGETQPGEKRRRMACTCPNCKDGEKR-SGEQGKKK-HVCHIPDCGKTFRKTSLLRAH
.. .. : :.. :: ::::: :::.: : ::. :::: :.::: :::.. ::: ::::
CCDS44 NSPDAQPQAGRRTRREACTCPYCKDSEGRGSGDPGKKKQHICHIQGCGKVYGKTSHLRAH
580 590 600 610 620 630
540 550 560 570 580 590
pF1KSD VRLHTGERPFVCNWFFCGKRFTRSDELQRHARTHTGDKRFECAQCQKRFMRSDHLTKHYK
.: :::::::.:.: .:::::::::::::: :::::.:.: : .: :::::::::.:: :
CCDS44 LRWHTGERPFMCTWSYCGKRFTRSDELQRHKRTHTGEKKFACPECPKRFMRSDHLSKHIK
640 650 660 670 680 690
600
pF1KSD THLVTKNL
::
CCDS44 THQNKKGGPGVALSVGTLPLDSGAGSEGSGTATPSALITTNMVAMEAICPEGIARLANSG
700 710 720 730 740 750
>>CCDS8857.1 SP1 gene_id:6667|Hs108|chr12 (785 aa)
initn: 758 init1: 493 opt: 844 Z-score: 440.8 bits: 92.0 E(32554): 3.1e-18
Smith-Waterman score: 933; 35.4% identity (58.2% similar) in 632 aa overlap (70-600:100-708)
40 50 60 70 80 90
pF1KSD PPAVEAAVTPPAPPQPTPRKLVPIKPAPLPLSPGKNSFGILSSKGNIL----QIQGSQLS
:: : :.. :.::... . .::. .
CCDS88 RIESPNENSNNSQGPSQSGGTGELDLTATQLSQGANGWQIISSSSGATPTSKEQSGSSTN
70 80 90 100 110 120
100 110 120 130 140
pF1KSD AS----------YPGGQLVFA----IQNPTMINKGTRSNANIQYQAVPQIQASNSQTIQ-
.: ::: : : .:: ... :::::..::.:. ..: .:
CCDS88 GSNGSESSKNRTVSGGQYVVAAAPNLQNQQVLTGLPGVMPNIQYQVIPQFQTVDGQQLQF
130 140 150 160 170 180
150 160 170 180 190
pF1KSD ------VQPNLTNQIQIIPGTNQAIITPSPSSHKPVPIKPAPIQKSSTTTTPVQSGANVV
:: . ..:::::::.:: ::: :. . . : .:.. .:.:. :: :
CCDS88 AATGAQVQQDGSGQIQIIPGANQQIITNRGSGGNIIAAMPNLLQQA----VPLQGLANNV
190 200 210 220 230 240
200 210 220 230
pF1KSD KLTGG-----------GGNVTLTLPVNNLVNASDTGAPTQLLT-------ESPPTPLSKT
:.: .::.:: ::::. :.:. .: .: :: :.. .
CCDS88 -LSGQTQYVTNVPVALNGNITL-LPVNS-VSAATLTPSSQAVTISSSGSQESGSQPVT-S
250 260 270 280 290 300
240 250 260 270
pF1KSD NKKARKKSLPASQPPVA-VAEQVETVLIETTADNI-------------------------
. . :: .:: . .... ::..:.
CCDS88 GTTISSASLVSSQASSSSFFTNANSYSTTTTTSNMGIMNFTTSGSSGTNSQGQTPQRVSG
310 320 330 340 350 360
280 290 300 310 320
pF1KSD IQAGNNLLIVQ--SPGGGQPAVVQQVQVVPPKAEQQQVVQIPQ-----QALRVVQAA---
.:... : : : . ::. : :. ...:::.. :: :::...:::
CCDS88 LQGSDALNIQQNQTSGGSLQAGQQKEGEQNQQTQQQQILIQPQLVQGGQALQALQAAPLS
370 380 390 400 410 420
330 340 350 360 370
pF1KSD --SATLPTVPQKPSQNFQIQAAEPTPTQVYIRTPS----GEV--QTVLVQDSPPATAAAT
. : .. :. ::.:.::. :. . ::::. :.: ::. .:. . :
CCDS88 GQTFTTQAISQETLQNLQLQAV-PNSGPIIIRTPTVGPNGQVSWQTLQLQNLQVQNPQAQ
430 440 450 460 470 480
380 390 400 410 420 430
pF1KSD SNTTCSSPASRAPHLSGTSKKHSAAILRKERPLPKIA--PAGSIISLNAAQLAAAAQAMQ
. : :: ..:.: .... :. . : :::.. ..:::::.. ..:
CCDS88 TITL-------AP-MQGVSLGQTSSSNTTLTPIASAASIPAGTV-TVNAAQLSSMP-GLQ
490 500 510 520 530
440 450 460 470 480
pF1KSD TININ-----GVQV---QGVPVTITNTGGQQ--QLTVQNVSGNNLTISGLSPTQIQLQME
:::.. :.:: ::.:..:.:. :.. :: .....:... . : . :
CCDS88 TINLSALGTSGIQVHPIQGLPLAIANAPGDHGAQLGLHGAGGDGIH----DDTAGGEEGE
540 550 560 570 580
490 500 510 520 530
pF1KSD QALAGETQPGEKRRRMACTCPNCKDGEKR-SGEQGKKK-HVCHIPDCGKTFRKTSLLRAH
.. .. : :.. :: ::::: :::.: : ::. :::: :.::: :::.. ::: ::::
CCDS88 NSPDAQPQAGRRTRREACTCPYCKDSEGRGSGDPGKKKQHICHIQGCGKVYGKTSHLRAH
590 600 610 620 630 640
540 550 560 570 580 590
pF1KSD VRLHTGERPFVCNWFFCGKRFTRSDELQRHARTHTGDKRFECAQCQKRFMRSDHLTKHYK
.: :::::::.:.: .:::::::::::::: :::::.:.: : .: :::::::::.:: :
CCDS88 LRWHTGERPFMCTWSYCGKRFTRSDELQRHKRTHTGEKKFACPECPKRFMRSDHLSKHIK
650 660 670 680 690 700
600
pF1KSD THLVTKNL
::
CCDS88 THQNKKGGPGVALSVGTLPLDSGAGSEGSGTATPSALITTNMVAMEAICPEGIARLANSG
710 720 730 740 750 760
>>CCDS5373.1 SP4 gene_id:6671|Hs108|chr7 (784 aa)
initn: 922 init1: 521 opt: 780 Z-score: 409.1 bits: 86.1 E(32554): 1.8e-16
Smith-Waterman score: 1102; 37.6% identity (60.3% similar) in 663 aa overlap (46-600:106-729)
20 30 40 50 60 70
pF1KSD AASTTQDSQPSPLALLAATCSKIGPPAVEAAVTPPAPPQPTPRKLVPIKPAPLPLSPGKN
: :::: . . . : : ...
CCDS53 PSQGLVQLQNQPQQLELVTTQLAGNAWQLVASTPPASKENNVSQ---------PASSSSS
80 90 100 110 120
80 90 100 110 120 130
pF1KSD SFGILSSKGNILQIQGSQLSASYPGGQLVFAIQNPTMINKGTRSNANIQYQAVPQIQASN
: . :..:. . .. ..: :: :. .:::. ...:::..::.:. .
CCDS53 SSS--SNNGSASPTKTKSGNSSTPGQFQVIQVQNPS---------GSVQYQVIPQLQTVE
130 140 150 160 170
140 150 160 170
pF1KSD SQTIQVQP-------NLTNQIQIIP-GTNQAIITPSPSSHK-------------PVPIKP
.: ::..: .: .:::.: :.::::.: . . . :: :.:
CCDS53 GQQIQINPTSSSSLQDLQGQIQLISAGNNQAILTAANRTASGNILAQNLANQTVPVQIRP
180 190 200 210 220 230
180 190 200
pF1KSD A---PIQKSS--------TTTTPVQSGANVVKL-------TGGG----------------
. :.: .. .:: :.. :. .. : .:::
CCDS53 GVSIPLQLQTLPGTQAQVVTTLPINIGGVTLALPVINNVAAGGGTGQVGQPAATADSGTS
240 250 260 270 280 290
210 220 230 240
pF1KSD -GNVTLTLPVNNLVNASD------------TGAPTQL-----LTESPPT-PLSKTNKKAR
:: .. :.:. ..:: : : :.: :. : : ..:. ..
CCDS53 NGNQLVSTPTNTTTSASTMPESPSSSTTCTTTASTSLTSSDTLVSSADTGQYASTSASSS
300 310 320 330 340 350
250 260 270 280 290
pF1KSD KKSLPASQPPVAVAEQVETV--LIETTADNIIQAGNNLLIVQSPGGGQPAVVQQVQVVPP
.... :: :.:. .... : . .: . .:.: :: : :: ..::.:. :
CCDS53 ERTIEESQTPAATESEAQSSSQLQPNGMQNAQDQSNSLQQVQIVG--QP-ILQQIQIQQP
360 370 380 390 400 410
300 310 320 330 340 350
pF1KSD KAEQQQVVQ-IPQQALRVVQAASATLPTVPQKPSQNFQIQAAEPTPTQVYIR----TPSG
:::..: :: :.... .. :. :. :.: :: :.::..:: :: :: ::::
CCDS53 ---QQQIIQAIPPQSFQL--QSGQTIQTIQQQPLQNVQLQAVNPT--QVLIRAPTLTPSG
420 430 440 450 460
360 370 380 390 400 410
pF1KSD EV--QTVLVQDSPPATAAATSNTTCSSPASRAPHLSGTSKKHSAAILRKERPLPKIAPAG
.. ::: ::. . ..:. :. . .: .:... : : : .: ::
CCDS53 QISWQTVQVQNIQSLSNLQVQNAGLSQQLTITP-VSSSGGTTLAQIA----P---VAVAG
470 480 490 500 510
420 430 440 450
pF1KSD SIISLNAAQLAAAAQAMQTININ-----GVQVQGVPVTITNTGGQQQ----LTVQN----
. :.::.::::.. . .::... ::::::::::::...:::: . ::.
CCDS53 APITLNTAQLASVPN-LQTVSVANLGAAGVQVQGVPVTITSVAGQQQGQDGVKVQQATIA
520 530 540 550 560 570
460 470 480 490 500
pF1KSD -----VSG-NNLTISGLSP---TQIQLQMEQALAG-ETQPGEKRRRMACTCPNCKDGEKR
:.: : ::...:: ::..::. : . :.:::.. ::.::.::::..:: :
CCDS53 PVTVAVGGIANATIGAVSPDQLTQVHLQQGQQTSDQEVQPGKRLRRVACSCPNCREGEGR
580 590 600 610 620 630
510 520 530 540 550 560
pF1KSD -SGEQGKKK-HVCHIPDCGKTFRKTSLLRAHVRLHTGERPFVCNWFFCGKRFTRSDELQR
:.: :::: :.::: :::.. ::: ::::.: :::::::.:::.::::::::::::::
CCDS53 GSNEPGKKKQHICHIEGCGKVYGKTSHLRAHLRWHTGERPFICNWMFCGKRFTRSDELQR
640 650 660 670 680 690
570 580 590 600
pF1KSD HARTHTGDKRFECAQCQKRFMRSDHLTKHYKTHLVTKNL
: :::::.::::: .:.:::::::::.:: :::
CCDS53 HRRTHTGEKRFECPECSKRFMRSDHLSKHVKTHQNKKGGGTALAIVTSGELDSSVTEVLG
700 710 720 730 740 750
CCDS53 SPRIVTVAAISQDSNPATPNVSTNMEEF
760 770 780
>>CCDS46452.1 SP3 gene_id:6670|Hs108|chr2 (713 aa)
initn: 711 init1: 511 opt: 756 Z-score: 397.7 bits: 83.9 E(32554): 7.8e-16
Smith-Waterman score: 840; 31.3% identity (55.5% similar) in 670 aa overlap (25-606:4-641)
10 20 30 40 50 60
pF1KSD MAATAAVSPSDYLQPAASTTQDSQPSPLALLAATCSKIGPPAVEAAVTPPAPPQPTPRKL
::: . . : ::. .:. : :
CCDS46 MGPPSPGDDEEEAAAAAGAPAAAGATGDLASAQLGG---
10 20 30
70 80 90 100 110
pF1KSD VPIKPAPLPLSPGKNSFGILSSKGNILQIQGSQLSASYPGGQLVFAIQNPTM-----INK
.: . : .: : . ::..:: ::. .:: :. .:: .
CCDS46 APNRWEVLSATPTT----IKDEAGNLVQIP----SAATSSGQYVLPLQNLQNQQIFSVAP
40 50 60 70 80
120 130 140 150 160
pF1KSD GTRSN----ANIQYQAVPQIQASNSQTIQV-----QPN-----LTNQIQIIPGTNQAII-
:. :. ...:::..::::....: .:. . : ..:::::::.::...
CCDS46 GSDSSNGTVSSVQYQVIPQIQSADGQQVQIGFTGSSDNGGINQESSQIQIIPGSNQTLLA
90 100 110 120 130 140
170 180 190
pF1KSD --TPSPSSHKPVP------IKPAPIQKSS------------------TTTTPVQSGANVV
::: . .. .: .. . : :: : .:..: ...
CCDS46 SGTPSANIQNLIPQTGQVQVQGVAIGGSSFPGQTQVVANVPLGLPGNITFVPINS-VDLD
150 160 170 180 190 200
200 210 220 230 240
pF1KSD KLTGGGGNVTLTLPVN---NLVN---ASDTGAPTQLLTE--SPPTPLSKTNKKARKKSLP
.: .:.. :.: .: .:.: : :.. .. : :: ..:. .
CCDS46 SLGLSGSSQTMTAGINADGHLINTGQAMDSSDNSERTGERVSPDINETNTDTDLFVPTSS
210 220 230 240 250 260
250 260 270 280 290
pF1KSD ASQPPVAVAE----QVETVLIETTADNIIQAGNNLLIVQSP------------GGGQPAV
.:: ::.. : .: . :.. .. .. . .::: . .:: :
CCDS46 SSQLPVTIDSTGILQQNTNSLTTSSGQVHSSDLQGNYIQSPVSEETQAQNIQVSTAQP-V
270 280 290 300 310 320
300 310 320 330 340
pF1KSD VQQVQVVPPK--AEQQQVVQ-IPQQALRVVQAASATLPTVPQKPSQNFQIQAAEPTPT-Q
::..:. . . : :.:: : :... :::.. .. :. ::.:.: : :
CCDS46 VQHLQLQESQQPTSQAQIVQGITPQTIHGVQASG---QNISQQALQNLQLQLNPGTFLIQ
330 340 350 360 370 380
350 360 370 380 390 400
pF1KSD VYIRTPSGEV--QTVLVQDSPPATAAATSNTTCSSPASRAPHLSGTSKKHSAAILRKERP
. ::::.: :: :: .::. .. . .: . :
CCDS46 AQTVTPSGQVTWQTFQVQGVQNLQNLQIQNTA-AQQITLTPVQTLT--------------
390 400 410 420
410 420 430 440 450
pF1KSD LPKIAPAGSIISLNAAQLAAAAQAMQTININGVQVQGVPVTI-TNTGGQQQLTVQN----
: ..: .:.. : .. .. .::...:... :. . :. . .. ...
CCDS46 LGQVAAGGAFTSTPVSLSTGQLPNLQTVTVNSIDSAGIQLHPGENADSPADIRIKEEEPD
430 440 450 460 470 480
460 470 480 490 500 510
pF1KSD -----VSGNN-LTISGLSPTQIQLQMEQALAGETQPGEKRRRMACTCPNCKDGEKRSGEQ
.::.. :. . :. ..:. :.. . : :.. ::.::::::::.: :. .
CCDS46 PEEWQLSGDSTLNTNDLTHLRVQVVDEEG-DQQHQEGKRLRRVACTCPNCKEGGGRGTNL
490 500 510 520 530 540
520 530 540 550 560 570
pF1KSD GKKK-HVCHIPDCGKTFRKTSLLRAHVRLHTGERPFVCNWFFCGKRFTRSDELQRHARTH
:::: :.:::: :::.. ::: ::::.: :.:::::::::..:::::::::::::: :::
CCDS46 GKKKQHICHIPGCGKVYGKTSHLRAHLRWHSGERPFVCNWMYCGKRFTRSDELQRHRRTH
550 560 570 580 590 600
580 590 600
pF1KSD TGDKRFECAQCQKRFMRSDHLTKHYKTHLVTKNL
::.:.: : .:.:::::::::.:: ::: :..
CCDS46 TGEKKFVCPECSKRFMRSDHLAKHIKTHQNKKGIHSSSTVLASVEAARDDTLITAGGTTL
610 620 630 640 650 660
CCDS46 ILANIQQGSVSGIGTVNTSATSNQDILTNTEIPLQLVTVSGNETME
670 680 690 700 710
>>CCDS2254.1 SP3 gene_id:6670|Hs108|chr2 (781 aa)
initn: 807 init1: 511 opt: 756 Z-score: 397.2 bits: 83.9 E(32554): 8.4e-16
Smith-Waterman score: 840; 31.3% identity (55.5% similar) in 670 aa overlap (25-606:72-709)
10 20 30 40 50
pF1KSD MAATAAVSPSDYLQPAASTTQDSQPSPLALLAATCSKIGPPAVEAAVTPPAPPQ
::: . . : ::. .:. : :
CCDS22 NGAVAAAAAAQDTQPSPLALLAATCSKIGPPSPGDDEEEAAAAAGAPAAAGATGDLASAQ
50 60 70 80 90 100
60 70 80 90 100 110
pF1KSD PTPRKLVPIKPAPLPLSPGKNSFGILSSKGNILQIQGSQLSASYPGGQLVFAIQNPTM--
.: . : .: : . ::..:: ::. .:: :. .::
CCDS22 LGG---APNRWEVLSATPTT----IKDEAGNLVQIP----SAATSSGQYVLPLQNLQNQQ
110 120 130 140 150
120 130 140 150
pF1KSD ---INKGTRSN----ANIQYQAVPQIQASNSQTIQV-----QPN-----LTNQIQIIPGT
. :. :. ...:::..::::....: .:. . : ..:::::::.
CCDS22 IFSVAPGSDSSNGTVSSVQYQVIPQIQSADGQQVQIGFTGSSDNGGINQESSQIQIIPGS
160 170 180 190 200 210
160 170 180
pF1KSD NQAII---TPSPSSHKPVP------IKPAPIQKSS------------------TTTTPVQ
::... ::: . .. .: .. . : :: : .:..
CCDS22 NQTLLASGTPSANIQNLIPQTGQVQVQGVAIGGSSFPGQTQVVANVPLGLPGNITFVPIN
220 230 240 250 260 270
190 200 210 220 230 240
pF1KSD SGANVVKLTGGGGNVTLTLPVN---NLVN---ASDTGAPTQLLTE--SPPTPLSKTNKKA
: ... .: .:.. :.: .: .:.: : :.. .. : :: ..:.
CCDS22 S-VDLDSLGLSGSSQTMTAGINADGHLINTGQAMDSSDNSERTGERVSPDINETNTDTDL
280 290 300 310 320
250 260 270 280
pF1KSD RKKSLPASQPPVAVAE----QVETVLIETTADNIIQAGNNLLIVQSP------------G
. .:: ::.. : .: . :.. .. .. . .::: .
CCDS22 FVPTSSSSQLPVTIDSTGILQQNTNSLTTSSGQVHSSDLQGNYIQSPVSEETQAQNIQVS
330 340 350 360 370 380
290 300 310 320 330 340
pF1KSD GGQPAVVQQVQVVPPK--AEQQQVVQ-IPQQALRVVQAASATLPTVPQKPSQNFQIQAAE
.:: :::..:. . . : :.:: : :... :::.. .. :. ::.:.:
CCDS22 TAQP-VVQHLQLQESQQPTSQAQIVQGITPQTIHGVQASG---QNISQQALQNLQLQLNP
390 400 410 420 430 440
350 360 370 380 390
pF1KSD PTPT-QVYIRTPSGEV--QTVLVQDSPPATAAATSNTTCSSPASRAPHLSGTSKKHSAAI
: :. ::::.: :: :: .::. .. . .: . :
CCDS22 GTFLIQAQTVTPSGQVTWQTFQVQGVQNLQNLQIQNTA-AQQITLTPVQTLT--------
450 460 470 480 490
400 410 420 430 440 450
pF1KSD LRKERPLPKIAPAGSIISLNAAQLAAAAQAMQTININGVQVQGVPVTI-TNTGGQQQLTV
: ..: .:.. : .. .. .::...:... :. . :. . .. .
CCDS22 ------LGQVAAGGAFTSTPVSLSTGQLPNLQTVTVNSIDSAGIQLHPGENADSPADIRI
500 510 520 530 540 550
460 470 480 490 500
pF1KSD QN---------VSGNN-LTISGLSPTQIQLQMEQALAGETQPGEKRRRMACTCPNCKDGE
.. .::.. :. . :. ..:. :.. . : :.. ::.::::::::.:
CCDS22 KEEEPDPEEWQLSGDSTLNTNDLTHLRVQVVDEEG-DQQHQEGKRLRRVACTCPNCKEGG
560 570 580 590 600
510 520 530 540 550 560
pF1KSD KRSGEQGKKK-HVCHIPDCGKTFRKTSLLRAHVRLHTGERPFVCNWFFCGKRFTRSDELQ
:. . :::: :.:::: :::.. ::: ::::.: :.:::::::::..::::::::::::
CCDS22 GRGTNLGKKKQHICHIPGCGKVYGKTSHLRAHLRWHSGERPFVCNWMYCGKRFTRSDELQ
610 620 630 640 650 660
570 580 590 600
pF1KSD RHARTHTGDKRFECAQCQKRFMRSDHLTKHYKTHLVTKNL
:: :::::.:.: : .:.:::::::::.:: ::: :..
CCDS22 RHRRTHTGEKKFVCPECSKRFMRSDHLAKHIKTHQNKKGIHSSSTVLASVEAARDDTLIT
670 680 690 700 710 720
CCDS22 AGGTTLILANIQQGSVSGIGTVNTSATSNQDILTNTEIPLQLVTVSGNETME
730 740 750 760 770 780
>>CCDS33322.1 SP5 gene_id:389058|Hs108|chr2 (398 aa)
initn: 721 init1: 523 opt: 569 Z-score: 308.4 bits: 66.5 E(32554): 7.4e-11
Smith-Waterman score: 594; 35.7% identity (55.6% similar) in 342 aa overlap (280-600:43-378)
250 260 270 280 290 300
pF1KSD PPVAVAEQVETVLIETTADNIIQAGNNLLIVQSPGGGQPAVVQQVQV-----VPPKAEQQ
. .::.. : :: : . .
CCDS33 QAFLQDRTPSASPDLGKHSPLALLAATCSRIGQPGAAAPPDFLQVPYDPALGSPSRLFHP
20 30 40 50 60 70
310 320 330 340 350 360
pF1KSD QVVQIPQQALRVVQAASATLPTVPQKPSQNFQIQAAEPTPTQVYIRTPSGEVQTVLVQDS
....: .. .. .: .::: . .. ::. : :: . :.
CCDS33 WTADMPAHSPGALPPPHPSLGLTPQKTHLQPSFGAAHELPLTPPA-DPSYPYEFSPVKML
80 90 100 110 120 130
370 380 390 400 410 420
pF1KSD PPATAAATSNTTCSSPASRAPHLSGTSKKHSAAILRKERPLPKIAPAGSIISLNAAQ---
: . :: . .:. :: .:. . .. . . : : : :. .: : :
CCDS33 PSSMAALPA--SCA-PA-YVPYAAQAALPPGYSNLLPPPPPPPPPPTCRQLSPNPAPDDL
140 150 160 170 180
430 440 450 460 470
pF1KSD -LAAAAQAMQTININGVQVQGVPVTITNTGGQQQLTVQNVSGNNLTIS---GL--SPT--
. :: . .:: .:. . ... .. .. ... . . :: .:.
CCDS33 PWWSIPQAGAGPGASGVPGSGLSGACAGAPHAPRFPASAAAAAAAAAALQRGLVLGPSDF
190 200 210 220 230 240
480 490 500 510 520
pF1KSD -QIQLQMEQALAGETQP--GEKRRRMACTCPNCKD-GEKRSGEQGKKK-HVCHIPDCGKT
: : :. :: : . :: : ::::. : .: :::: ::::.: :::.
CCDS33 AQYQSQIA-ALLQTKAPLAATARRCRRCRCPNCQAAGGAPEAEPGKKKQHVCHVPGCGKV
250 260 270 280 290 300
530 540 550 560 570 580
pF1KSD FRKTSLLRAHVRLHTGERPFVCNWFFCGKRFTRSDELQRHARTHTGDKRFECAQCQKRFM
. ::: :.::.: :::::::::::.:::: :::::::::: :::::.::: : .: ::::
CCDS33 YGKTSHLKAHLRWHTGERPFVCNWLFCGKSFTRSDELQRHLRTHTGEKRFACPECGKRFM
310 320 330 340 350 360
590 600
pF1KSD RSDHLTKHYKTHLVTKNL
:::::.:: :::
CCDS33 RSDHLAKHVKTHQNKKLKVAEAGVKREDARDL
370 380 390
606 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Wed Nov 2 23:37:24 2016 done: Wed Nov 2 23:37:24 2016
Total Scan time: 3.730 Total Display time: 0.100
Function used was FASTA [36.3.4 Apr, 2011]