FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE3984, 204 aa
1>>>pF1KE3984 204 - 204 aa - 204 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.0583+/-0.000626; mu= 15.1234+/- 0.038
mean_var=73.3949+/-14.871, 0's: 0 Z-trim(112.5): 105 B-trim: 433 in 1/50
Lambda= 0.149707
statistics sampled from 13085 (13211) to 13085 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.777), E-opt: 0.2 (0.406), width: 16
Scan time: 1.940
The best scores are: opt bits E(32554)
CCDS54850.1 ARL15 gene_id:54622|Hs108|chr5 ( 204) 1373 304.9 2.2e-83
CCDS9695.1 ARF6 gene_id:382|Hs108|chr14 ( 175) 337 81.1 4.4e-16
CCDS8088.1 ARL2 gene_id:402|Hs108|chr11 ( 184) 323 78.1 3.7e-15
CCDS8774.1 ARF3 gene_id:377|Hs108|chr12 ( 181) 322 77.9 4.2e-15
CCDS1565.1 ARF1 gene_id:375|Hs108|chr1 ( 181) 315 76.4 1.2e-14
CCDS34745.1 ARF5 gene_id:381|Hs108|chr7 ( 180) 314 76.2 1.4e-14
CCDS7538.1 ARL3 gene_id:403|Hs108|chr10 ( 182) 314 76.2 1.4e-14
CCDS3192.1 ARL14 gene_id:80117|Hs108|chr3 ( 192) 310 75.3 2.7e-14
CCDS43322.1 TRIM23 gene_id:373|Hs108|chr5 ( 569) 314 76.6 3.3e-14
CCDS3987.1 TRIM23 gene_id:373|Hs108|chr5 ( 574) 314 76.6 3.4e-14
CCDS2884.1 ARF4 gene_id:378|Hs108|chr3 ( 180) 299 72.9 1.3e-13
CCDS2925.1 ARL13B gene_id:200894|Hs108|chr3 ( 428) 292 71.7 7.3e-13
CCDS2566.1 ARL8B gene_id:55207|Hs108|chr3 ( 186) 286 70.1 9.5e-13
CCDS1421.1 ARL8A gene_id:127829|Hs108|chr1 ( 186) 282 69.3 1.7e-12
CCDS11463.1 ARL4D gene_id:379|Hs108|chr17 ( 201) 281 69.1 2.1e-12
CCDS3986.1 TRIM23 gene_id:373|Hs108|chr5 ( 546) 284 70.1 2.9e-12
CCDS9419.1 ARL11 gene_id:115761|Hs108|chr13 ( 196) 275 67.8 5.1e-12
CCDS5359.1 ARL4A gene_id:10124|Hs108|chr7 ( 200) 273 67.4 7e-12
CCDS44958.1 ARL1 gene_id:400|Hs108|chr12 ( 181) 267 66.0 1.6e-11
CCDS2512.1 ARL4C gene_id:10123|Hs108|chr2 ( 192) 262 65.0 3.5e-11
CCDS63169.1 ARL4C gene_id:10123|Hs108|chr2 ( 201) 262 65.0 3.7e-11
CCDS2928.1 ARL6 gene_id:84100|Hs108|chr3 ( 186) 256 63.7 8.5e-11
>>CCDS54850.1 ARL15 gene_id:54622|Hs108|chr5 (204 aa)
initn: 1373 init1: 1373 opt: 1373 Z-score: 1610.6 bits: 304.9 E(32554): 2.2e-83
Smith-Waterman score: 1373; 100.0% identity (100.0% similar) in 204 aa overlap (1-204:1-204)
10 20 30 40 50 60
pF1KE3 MSDLRITEAFLYMDYLCFRALCCKGPPPARPEYDLVCIGLTGSGKTSLLSKLCSESPDNV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 MSDLRITEAFLYMDYLCFRALCCKGPPPARPEYDLVCIGLTGSGKTSLLSKLCSESPDNV
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE3 VSTTGFSIKAVPFQNAILNVKELGGADNIRKYWSRYYQGSQGVIFVLDSASSEDDLEAAR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 VSTTGFSIKAVPFQNAILNVKELGGADNIRKYWSRYYQGSQGVIFVLDSASSEDDLEAAR
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE3 NELHSALQHPQLCTLPFLILANHQDKPAARSVQEIKKYFELEPLARGKRWILQPCSLDDM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS54 NELHSALQHPQLCTLPFLILANHQDKPAARSVQEIKKYFELEPLARGKRWILQPCSLDDM
130 140 150 160 170 180
190 200
pF1KE3 DALKDSFSQLINLLEEKDHEAVRM
::::::::::::::::::::::::
CCDS54 DALKDSFSQLINLLEEKDHEAVRM
190 200
>>CCDS9695.1 ARF6 gene_id:382|Hs108|chr14 (175 aa)
initn: 290 init1: 221 opt: 337 Z-score: 402.2 bits: 81.1 E(32554): 4.4e-16
Smith-Waterman score: 337; 35.2% identity (69.2% similar) in 159 aa overlap (32-190:13-169)
10 20 30 40 50 60
pF1KE3 SDLRITEAFLYMDYLCFRALCCKGPPPARPEYDLVCIGLTGSGKTSLLSKLCSESPDNVV
:. .. .:: ..:::..: :: . ...
CCDS96 MGKVLSKIFGNKEMRILMLGLDAAGKTTILYKLKLGQSVTTI
10 20 30 40
70 80 90 100 110 120
pF1KE3 STTGFSIKAVPFQNAILNVKELGGADNIRKYWSRYYQGSQGVIFVLDSASSEDDLEAARN
:.::....: ..:. .:: ..:: :.:: : .:: :.::.:::.: :. .: .. ::.
CCDS96 PTVGFNVETVTYKNVKFNVWDVGGQDKIRPLWRHYYTGTQGLIFVVDCAD-RDRIDEARQ
50 60 70 80 90 100
130 140 150 160 170 180
pF1KE3 ELHSALQHPQLCTLPFLILANHQDKPAARSVQEIKKYFELEPLARGKRWILQPCSLDDMD
::: .. .. .::.::.:: : : . .::.. . : . : . : .:: . :
CCDS96 ELHRIINDREMRDAIILIFANKQDLPDAMKPHEIQEKLGLTRI-RDRNWYVQPSCATSGD
110 120 130 140 150 160
190 200
pF1KE3 ALKDSFSQLINLLEEKDHEAVRM
.: .... :
CCDS96 GLYEGLTWLTSNYKS
170
>>CCDS8088.1 ARL2 gene_id:402|Hs108|chr11 (184 aa)
initn: 307 init1: 201 opt: 323 Z-score: 385.6 bits: 78.1 E(32554): 3.7e-15
Smith-Waterman score: 323; 34.7% identity (68.9% similar) in 167 aa overlap (32-191:16-180)
10 20 30 40 50 60
pF1KE3 SDLRITEAFLYMDYLCFRALCCKGPPPARPEYDLVCIGLTGSGKTSLLSKLCSESPDNVV
: :. .:: ..:::..:.:. .:. :..
CCDS80 MGLLTILKKMKQKERELRLLMLGLDNAGKTTILKKFNGEDIDTIS
10 20 30 40
70 80 90 100 110 120
pF1KE3 STTGFSIKAVPFQNAILNVKELGGADNIRKYWSRYYQGSQGVIFVLDSASSEDDLEAARN
: ::.::.. .. ::. ..:: ..:.:: :.....:.:.:.:::. . .. .
CCDS80 PTLGFNIKTLEHRGFKLNIWDVGGQKSLRSYWRNYFESTDGLIWVVDSADRQR-MQDCQR
50 60 70 80 90 100
130 140 150 160 170
pF1KE3 ELHSALQHPQLCTLPFLILANHQDKPAARSVQEIKKYFELEPLARGKRWILQPCS-----
::.: : . .: .::.::.:: :.: : . :.. .::. . :...: .: ::
CCDS80 ELQSLLVEERLAGATLLIFANKQDLPGALSSNAIREVLELDSI-RSHHWCIQGCSAVTGE
110 120 130 140 150 160
180 190 200
pF1KE3 --LDDMDALKDSFSQLINLLEEKDHEAVRM
: .: : :..:. :
CCDS80 NLLPGIDWLLDDISSRIFTAD
170 180
>>CCDS8774.1 ARF3 gene_id:377|Hs108|chr12 (181 aa)
initn: 213 init1: 213 opt: 322 Z-score: 384.5 bits: 77.9 E(32554): 4.2e-15
Smith-Waterman score: 322; 33.9% identity (65.5% similar) in 168 aa overlap (30-197:15-180)
10 20 30 40 50 60
pF1KE3 MSDLRITEAFLYMDYLCFRALCCKGPPPARPEYDLVCIGLTGSGKTSLLSKLCSESPDNV
. :. .. .:: ..:::..: :: ..
CCDS87 MGNIFGNLLKSLIGKKEMRILMVGLDAAGKTTILYKLKLGEIVTT
10 20 30 40
70 80 90 100 110 120
pF1KE3 VSTTGFSIKAVPFQNAILNVKELGGADNIRKYWSRYYQGSQGVIFVLDSASSEDDLEAAR
. : ::....: ..: ..: ..:: :.:: : .:.:..::.:::.:: . : .. ::
CCDS87 IPTIGFNVETVEYKNISFTVWDVGGQDKIRPLWRHYFQNTQGLIFVVDSNDRER-VNEAR
50 60 70 80 90 100
130 140 150 160 170 180
pF1KE3 NELHSALQHPQLCTLPFLILANHQDKPAARSVQEIKKYFELEPLARGKRWILQPCSLDDM
.:: : . .: .:..::.:: : : .. :: . :. : : . : .: .
CCDS87 EELMRMLAEDELRDAVLLVFANKQDLPNAMNAAEITDKLGLHSL-RHRNWYIQATCATSG
110 120 130 140 150 160
190 200
pF1KE3 DALKDSFSQLINLLEEKDHEAVRM
:.: .... : : :..:
CCDS87 DGLYEGLDWLANQLKNKK
170 180
>>CCDS1565.1 ARF1 gene_id:375|Hs108|chr1 (181 aa)
initn: 213 init1: 213 opt: 315 Z-score: 376.4 bits: 76.4 E(32554): 1.2e-14
Smith-Waterman score: 315; 33.3% identity (65.5% similar) in 168 aa overlap (30-197:15-180)
10 20 30 40 50 60
pF1KE3 MSDLRITEAFLYMDYLCFRALCCKGPPPARPEYDLVCIGLTGSGKTSLLSKLCSESPDNV
. :. .. .:: ..:::..: :: ..
CCDS15 MGNIFANLFKGLFGKKEMRILMVGLDAAGKTTILYKLKLGEIVTT
10 20 30 40
70 80 90 100 110 120
pF1KE3 VSTTGFSIKAVPFQNAILNVKELGGADNIRKYWSRYYQGSQGVIFVLDSASSEDDLEAAR
. : ::....: ..: ..: ..:: :.:: : .:.:..::.:::.:: . : .. ::
CCDS15 IPTIGFNVETVEYKNISFTVWDVGGQDKIRPLWRHYFQNTQGLIFVVDSNDRER-VNEAR
50 60 70 80 90 100
130 140 150 160 170 180
pF1KE3 NELHSALQHPQLCTLPFLILANHQDKPAARSVQEIKKYFELEPLARGKRWILQPCSLDDM
.:: : . .: .:..::.:: : : .. :: . :. : : . : .: .
CCDS15 EELMRMLAEDELRDAVLLVFANKQDLPNAMNAAEITDKLGLHSL-RHRNWYIQATCATSG
110 120 130 140 150 160
190 200
pF1KE3 DALKDSFSQLINLLEEKDHEAVRM
:.: .... : : :...
CCDS15 DGLYEGLDWLSNQLRNQK
170 180
>>CCDS34745.1 ARF5 gene_id:381|Hs108|chr7 (180 aa)
initn: 287 init1: 202 opt: 314 Z-score: 375.2 bits: 76.2 E(32554): 1.4e-14
Smith-Waterman score: 314; 32.7% identity (66.1% similar) in 168 aa overlap (30-197:15-180)
10 20 30 40 50 60
pF1KE3 MSDLRITEAFLYMDYLCFRALCCKGPPPARPEYDLVCIGLTGSGKTSLLSKLCSESPDNV
. .. .. .:: ..:::..: :: ..
CCDS34 MGLTVSALFSRIFGKKQMRILMVGLDAAGKTTILYKLKLGEIVTT
10 20 30 40
70 80 90 100 110 120
pF1KE3 VSTTGFSIKAVPFQNAILNVKELGGADNIRKYWSRYYQGSQGVIFVLDSASSEDDLEAAR
. : ::....: ..: ..: ..:: :.:: : .:.:..::.:::.:: . : :.:
CCDS34 IPTIGFNVETVEYKNICFTVWDVGGQDKIRPLWRHYFQNTQGLIFVVDSNDRERVQESA-
50 60 70 80 90 100
130 140 150 160 170 180
pF1KE3 NELHSALQHPQLCTLPFLILANHQDKPAARSVQEIKKYFELEPLARGKRWILQPCSLDDM
.::.. ::. .: .:..::.:: : : :.:. . :. : :.. : .: .
CCDS34 DELQKMLQEDELRDAVLLVFANKQDMPNAMPVSELTDKLGLQHL-RSRTWYVQATCATQG
110 120 130 140 150 160
190 200
pF1KE3 DALKDSFSQLINLLEEKDHEAVRM
.: :... : . : ..
CCDS34 TGLYDGLDWLSHELSKR
170 180
>>CCDS7538.1 ARL3 gene_id:403|Hs108|chr10 (182 aa)
initn: 275 init1: 214 opt: 314 Z-score: 375.2 bits: 76.2 E(32554): 1.4e-14
Smith-Waterman score: 314; 35.0% identity (70.7% similar) in 157 aa overlap (32-188:17-171)
10 20 30 40 50 60
pF1KE3 SDLRITEAFLYMDYLCFRALCCKGPPPARPEYDLVCIGLTGSGKTSLLSKLCSESPDNVV
: .. .:: ..:::.::..: ::. ....
CCDS75 MGLLSILRKLKSAPDQEVRILLLGLDNAGKTTLLKQLASEDISHIT
10 20 30 40
70 80 90 100 110 120
pF1KE3 STTGFSIKAVPFQNAILNVKELGGADNIRKYWSRYYQGSQGVIFVLDSASSEDDLEAARN
: ::.::.: :. ::: ..:: .:: ::. :..... .:.:.:::. . .: . .
CCDS75 PTQGFNIKSVQSQGFKLNVWDIGGQRKIRPYWKNYFENTDILIYVIDSADRKR-FEETGQ
50 60 70 80 90 100
130 140 150 160 170 180
pF1KE3 ELHSALQHPQLCTLPFLILANHQDKPAARSVQEIKKYFELEPLARGKRWILQPCSLDDMD
:: :.. .: .: ::.::.:: .: ..:: . ..:. . : . : .: :: .
CCDS75 ELAELLEEEKLSCVPVLIFANKQDLLTAAPASEIAEGLNLHTI-RDRVWQIQSCSALTGE
110 120 130 140 150 160
190 200
pF1KE3 ALKDSFSQLINLLEEKDHEAVRM
...:...
CCDS75 GVQDGMNWVCKNVNAKKK
170 180
>>CCDS3192.1 ARL14 gene_id:80117|Hs108|chr3 (192 aa)
initn: 193 init1: 193 opt: 310 Z-score: 370.2 bits: 75.3 E(32554): 2.7e-14
Smith-Waterman score: 310; 27.1% identity (68.4% similar) in 177 aa overlap (28-203:9-182)
10 20 30 40 50 60
pF1KE3 MSDLRITEAFLYMDYLCFRALCCKGPPPARPEYDLVCIGLTGSGKTSLLSKLCSESPDNV
: . ... .:: ..::..:: :: . ..
CCDS31 MGSLGSKNPQTKQAQVLLLGLDSAGKSTLLYKLKLAKDITT
10 20 30 40
70 80 90 100 110
pF1KE3 VSTTGFSIKAVPFQ-NAILNVKELGGADNIRKYWSRYYQGSQGVIFVLDSASSEDDLEAA
. : ::... . .. : :.: ..:: ...: :. : ....:...:.:: .... :: .
CCDS31 IPTIGFNVEMIELERNLSLTVWDVGGQEKMRTVWGCYCENTDGLVYVVDS-TDKQRLEES
50 60 70 80 90 100
120 130 140 150 160 170
pF1KE3 RNELHSALQHPQLCTLPFLILANHQDKPAARSVQEIKKYFELEPLARGKRWILQPCSLDD
. ... :.. .. ..: ..:::.:: :.: ....: ..:... : . : .:::
CCDS31 QRQFEHILKNEHIKNVPVVLLANKQDMPGALTAEDITRMFKVKKLCSDRNWYVQPCCALT
110 120 130 140 150 160
180 190 200
pF1KE3 MDALKDSFSQLINLLEEKDHEAVRM
..: ..: .: ... :.: :
CCDS31 GEGLAQGFRKLTGFV--KSHMKSRGDTLAFFKQN
170 180 190
>>CCDS43322.1 TRIM23 gene_id:373|Hs108|chr5 (569 aa)
initn: 198 init1: 198 opt: 314 Z-score: 368.4 bits: 76.6 E(32554): 3.3e-14
Smith-Waterman score: 314; 35.8% identity (66.9% similar) in 151 aa overlap (25-175:400-546)
10 20 30 40 50
pF1KE3 MSDLRITEAFLYMDYLCFRALCCKGPPPARPEYDLVCIGLTGSGKTSLLSKLCS
:: . : .: .:: :.:::..: :: .
CCDS43 QQQQFTEVADHIQLDASIPVTFTKDNRVHIGP---KMEIRVVTLGLDGAGKTTILFKLKQ
370 380 390 400 410 420
60 70 80 90 100 110
pF1KE3 ESPDNVVSTTGFSIKAVPFQNAILNVKELGGADNIRKYWSRYYQGSQGVIFVLDSASSED
. . . : ::....: ..: ... ..:: ..: :..:: ..:.:.::.:: : .:
CCDS43 DEFMQPIPTIGFNVETVEYKNLKFTIWDVGGKHKLRPLWKHYYLNTQAVVFVVDS-SHRD
430 440 450 460 470 480
120 130 140 150 160 170
pF1KE3 DLEAARNELHSALQHPQLCTLPFLILANHQDKPAARSVQEIKKYFELEPLARGKRWILQP
. :..:: . : . .: .::.::.:: .: ::.:: . . :. : :. : .:
CCDS43 RISEAHSELAKLLTEKELRDALLLIFANKQDVAGALSVEEITELLSLHKLCCGRSWYIQG
490 500 510 520 530 540
180 190 200
pF1KE3 CSLDDMDALKDSFSQLINLLEEKDHEAVRM
:
CCDS43 CDARSVFQIICDQYTGKEVVTEKG
550 560
>>CCDS3987.1 TRIM23 gene_id:373|Hs108|chr5 (574 aa)
initn: 258 init1: 198 opt: 314 Z-score: 368.4 bits: 76.6 E(32554): 3.4e-14
Smith-Waterman score: 314; 35.8% identity (66.9% similar) in 151 aa overlap (25-175:400-546)
10 20 30 40 50
pF1KE3 MSDLRITEAFLYMDYLCFRALCCKGPPPARPEYDLVCIGLTGSGKTSLLSKLCS
:: . : .: .:: :.:::..: :: .
CCDS39 QQQQFTEVADHIQLDASIPVTFTKDNRVHIGP---KMEIRVVTLGLDGAGKTTILFKLKQ
370 380 390 400 410 420
60 70 80 90 100 110
pF1KE3 ESPDNVVSTTGFSIKAVPFQNAILNVKELGGADNIRKYWSRYYQGSQGVIFVLDSASSED
. . . : ::....: ..: ... ..:: ..: :..:: ..:.:.::.:: : .:
CCDS39 DEFMQPIPTIGFNVETVEYKNLKFTIWDVGGKHKLRPLWKHYYLNTQAVVFVVDS-SHRD
430 440 450 460 470 480
120 130 140 150 160 170
pF1KE3 DLEAARNELHSALQHPQLCTLPFLILANHQDKPAARSVQEIKKYFELEPLARGKRWILQP
. :..:: . : . .: .::.::.:: .: ::.:: . . :. : :. : .:
CCDS39 RISEAHSELAKLLTEKELRDALLLIFANKQDVAGALSVEEITELLSLHKLCCGRSWYIQG
490 500 510 520 530 540
180 190 200
pF1KE3 CSLDDMDALKDSFSQLINLLEEKDHEAVRM
:
CCDS39 CDARSGMGLYEGLDWLSRQLVAAGVLDVA
550 560 570
204 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sun Nov 6 08:21:17 2016 done: Sun Nov 6 08:21:18 2016
Total Scan time: 1.940 Total Display time: 0.000
Function used was FASTA [36.3.4 Apr, 2011]